Ansj中文分词

这是一个基于Google语义模型+条件随机场模型的中文分词的Java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典等功能,可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。

建议使用最新版的Ansj_seg。如果你用的是1.x版本或2.x版本,请根据需要下载对应的版本并导入到Eclipse中,开始你的程序。

Maven配置:

在你的pom.xml中加入以下内容:


<project>

  ...

  <repositories>

    <repository>

      <id>mvn-repo</id>

      <url>http://

</url></repository></repositories></project>