几种分词工具的jar包(IKAnalyzer、hanlp、mmseg4janalysis)
几种分词工具都试过,对于中文来说的的话个人觉得IKAnalyzer最好用,不同版本的IKAnalyzerjar包,包括IKAnalyzer6.5.0、IKAnalyzer5.0、IKAnalyzer2012,IKAnalyzer6.5.0可完美兼容Lucene6+,IKAnalyzer5.0兼容Lucene5+,亲测在用。
用户评论
推荐下载
-
IKAnalyzer6.5.0中文分词工具下载
IKAnalyzer6.5.0是一款高效的中文分词工具,支持常见的中文分词算法,如最大匹配法、最小匹配法等。该工具易于使用,可以帮助用户将中文文本进行分词处理,提高文本处理的效率。如果您需要下载IKA
12 2023-03-28 -
IKAnalyzer最强的中文分词器
从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Lucene为应用主体的,结合词典分词和文法分析算法的中文分词组件。新版本的IKAnalyzer3.
16 2020-08-30 -
IKAnalyzer分词器jar包支持同义词扩展词和停止词
自己打包并经过测试的,IKAnalyzerSolrFactory这个类是jdk1.6编辑的,需要高版本的可自己改。同义词可在core的conf里面单独配置,扩展词和停止词在应用的WEB-INF下cla
41 2019-05-28 -
hanlp_152jar
hanlp-1.5.2.jar,Java处理汉字语言文字jar包,包括简繁转换,拼音转换等。
25 2019-01-11 -
hanlp1.7.7.jar
手动下载hanlp相关jar包,用于python相关自然语言的工具,可进行分词、短语提取、摘要提取等
26 2020-07-21 -
solr分词器资源solr_ikanalyzer资源包
solr-ik分词器的资源包,包括:ext.dic;ikanalyzer.cfg.xml;ik-analyzer-solr5-5.x.jar;solr-analyzer-ik-5.1.0.jar;st
42 2019-05-25 -
ikanalyzer_solr中文分词包兼容solr7.5
zip包含ik-analyzer-solr5-5.x.jar,ext.dic,IKAnalyzer.cfg.xml,stopword.dic。可以兼容solr7,亲测可用。
18 2019-05-13 -
IKAnalyzer中文分词器v3.2.0源码包
IKAnalyzer中文分词器v3.2.0稳定版本的源码包
12 2019-09-24 -
mmseg4j solr2.4.0.jar
solr6.3下好用的mmseg4j分词库,测试可用。
4 2020-08-31 -
ictclas4j分词工具包
Ictclas4j word segmentation kit
17 2019-06-22
暂无评论