暂无评论
小文章,大信息
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始, IKAnalyzer已经推出了4个大版本。最初,它是以开源项目Luence为应
solr4.10.3+IK Analyzer For Solr4.x 发现资源不太好找,或者比较“贵 ” 自己发一个
IKAnalyzer官网的链接打不开,自己在网上苦苦搜了老半天,支持lucene4.x很好用的分词器
由于IK官方的IK Analyzer 2012FF_hf1.zip 只支持到V4,V5配置官方的这个会报抽象方法错误,这个也是网上找的大牛的基于源码修复过的,亲测在solr 5.2.0下可用。
IK-Analyzer官方只支持到了Lucene5,自行编译支持到Lucene6.6.2。
ik分词器jar包下载jar包:IK-Analyzer-extra-5.3.1.jarIKAnalyzer5.3.1.jarlucene-core-5.3.1.jarlucene-analyzers-
IK-Analyzer中文分词器
中文停用词表,Python做词频统计需要用到,怎么使用请看我博客!
百度停用词,亲测可用。用来进行文本分类,检索,聚类使用
暂无评论