本人从搜狗词库下载后转化为Lucene中文分词所需的词库,里面搜集的都是官方推荐的内容本人亲测可用。使用Solr5.2.1测试
张华平博士正式发布ICTCLAS2013版本,为了与以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,从本版本开始,系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年,
非常棒的中文分词库,自带4个中文库也可支持外部词库导入。。全面支持c/c++/java二次开发
java实现中科大ICTCLAS2015分词,源代码和jar包之前都有提供。
中科院分词(ICTCLAS30.dll),去除时间限制破解版。 只是包含DLL文件,不含其他文件。
NLPIR汉语分词系统(又名ICTCLAS2015),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平
本程序使用ICTCLAS中文分词系统,支持中文分词,同时实现高效率的关键字匹配,使用的分词系统支持用户自定义词典,并支持GBK和UTF-8编码,在Linux系统上运行,同时避免某些因证书引起的问题,适
中科院ICTCLAS2014分词系统下载包,文本分析工具,方便使用。
中科院ICTCLAS50_Windows分词,内含32位与64位
也是去年收集的资料,转载到csdn大家一起学习研究。版权属原作者所有。