es提供的分词是英文分词,对于中文的分词就做的非常不好了,ik分词器是针对中文分词来用于搜索和使用。
solr的ik分词器jar包,里面有5-5x和7x两个版本,手动狗头
NULL博文链接:https://phyeas.iteye.com/blog/644388
该版本适用于高版本Solr4.x,IK分词器IKAnalyzer2012FF_hf1Solr4.x
从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Lucene为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.
Linux-CentOS环境下:分布式索引服务-elasticsearch-6.2.4版本及ik分词器整包,包括(elasticsearch-6.2.4.tar.gz,ik-analyzer.zip)
中科院语义分词 ICTCLAS 中科院官方于2009年2月19日发布了中科院中文分词器ICTCLAS2009版,转引官方介绍说明,新版本的中文分词系统在原有的基础上主要完善的有: 1、用户词典接口扩展
最新2012版IKAnalyzer中文分词器,比IKAnalyzer3.2.8版本有所优化
ElasticSearch6.8.3中文IK分词,官网下载比较慢,放到这里,压缩包下载后,在plugins目录下新建目录Ik,然后把压缩包复制到ik目录下解压,解压后重启ElasticSearch,如
ik-analyzer-8.3.0,强大的中文分词器,已经在项目中成功使用