基于中文的Shuzhen分词器1.1.4提供下载
此版本改进为:分词时采用了完全匹配方式(自命名的),也即将符合字典条目的词全部切分出来,在基于字典的分词中达到了“分无可分”的程度;分词时完全按照标准分词来进行,这样保证了在和一些高亮显示组件如highlighter一起使用时,能准确无误的将命中进行高亮显示,避免了Google高亮显示的Bug;配置文件的存放支持相对路径,这样更灵活,更方便应用在一些虚拟机上;字典条目支持导入到内存中,也就是在原有JDBM字典系统的基础上增加内存字典系统,且能方便自定义导入多少条目到内存中,能自定义使用内存还是JDBM字典系统还是两者结合起来使用,从而提高了索引创建速度;改进了对搜索词的处理;能对字典系统进行管理;另外也提供适合jdk1.5的版本。详细信息可参见官方网站:h
用户评论
推荐下载
-
ansj分词器手册
ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict.中文分词,人名识别,词性标注,用户自定义词典
24 2019-05-16 -
IK分词器源码
IK分词器源码,可以研究IK分词器原理,也可以修改源码达到自己的业务需求。
28 2019-07-19 -
各类分词器合集
中文分词开源项目JAVA中文分词中文分词开源项目JAVA中文分词一个当10个
23 2019-07-07 -
结巴分词器组件
结巴分词器组件,python下的中文分词工作,挺好用的.
21 2019-07-11 -
elasticsearch分词器插件
因为Elasticsearch中默认的标准分词器分词器对中文分词不是很友好,会将中文词语拆分成一个一个中文的汉子。因此引入中文分词器-es-ik插件
33 2019-05-06 -
jieba分词器字典
jieba分词器所用的字典,包含词频以及词性,可自行调整频次等属性。(仅做学习交流用,禁止商用)
90 2019-05-02 -
ik分词器文档
ik分词器的搭建.
20 2020-07-19 -
IKAnalyzer3.2.8.jar中文分词器下载及实用说明
IKAnalyzer3.2.8 中文分词器支持最新的lucene,支持自定义词库和stop词库,简单易用。
17 2020-10-29 -
中文分词器工具包下载配置加Jar包
IK配置+两个Jar包,实现与Solr7.2.1版本的对接,对中文语句进行分词处理,可自行扩展词库字段ext.dict以及停止词字典dict
55 2019-05-19 -
solr5的ik中文分词器源码
solr5的ik中文分词器源码,解压后需要自己打包成jar包
18 2020-09-27
暂无评论