jcseg 是使用 Java 开发的一款开源的中文分词器, 使用 mmseg 算法. 分词准确率高达 98.4%, 支持中文人名识别, 同义词匹配, 停止词过滤... Jcseg 详细功能介绍: (可以略过, 方便查看新版本功能变化) 1。目前最高版本:jcseg-1.9.2。兼容最高版本 lucene-4.x 和最高版本 solr-4.x 2。mmseg 四种过滤算法,分词准确率达到了 98.41%。 3。支持自定义词库。在 lexicon 文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了 分类。参考下面了解如何给 jcseg 添加词库/新词。 4。(!New) 支持词库