Ansj中文分词是一款纯Java、主要用于自然语言处理、高精度的中文分词工具,目标是“准确、高效、自由地进行中文分词”。内容简介:http://www.iteye.com/magazines/102#234此分词具有自己学习的功能,所以拜托大家不要.乱提交数据.会带坏人家的.说着神秘.其实是一种机器学习动态规划模型!如果你发现此模式分词存在问题.可以看.新词发现.是此分词的初始版本!此分词保证了准确率,具有人名识别的功能!此分词结果,具有新词发现,人名识别,机构名识别.也许准确率稍差.但是非常具有应用价值!献给广大使用lucene要求高召回率的同学.没什么技术含量.但是很实用!