Ansj中文分词
这是一个基于Google语义模型+条件随机场模型的中文分词的Java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典等功能,可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。
建议使用最新版的Ansj_seg。如果你用的是1.x版本或2.x版本,请根据需要下载对应的版本并导入到Eclipse中,开始你的程序。
Maven配置:
在你的pom.xml中加入以下内容:
<project>
...
<repositories>
<repository>
<id>mvn-repo</id>
<url>http://
</url></repository></repositories></project>
暂无评论