mmseg4j-191

daisybil53644 28 0 ZIP 2019-01-12 23:01:41

mmseg4j用Chih-Hao Tsai 的MMSeg算法实现的中文分词器,并实现lucene的analyzer和solr的TokenizerFactory以方便在Lucene和Solr中使用。 MMSeg 算法有两种分词方法:Simple和Complex,都是基于正向最大匹配。Complex加了四个规则过虑。官方说:词语的正确识别率达到了 98.41%。mmseg4j已经实现了这两种分词算法。

用户评论
请输入评论内容
评分:
Generic placeholder image 卡了网匿名网友 2019-01-12 23:01:41

这个东西非常好

Generic placeholder image 卡了网匿名网友 2019-01-12 23:01:41

真是不错,正好学习

Generic placeholder image 卡了网匿名网友 2019-01-12 23:01:41

免费实用赞

Generic placeholder image 卡了网匿名网友 2019-01-12 23:01:41

之前下的1.8,不支持高版本的lucene了, 这个果然可以

Generic placeholder image 卡了网匿名网友 2019-01-12 23:01:41

很好,相当不错