Lucene6.5.0 下中文分词IKAnalyzer编译和使用-附件资源
麻将中文分词 简介 麻将一直是广受欢迎的传统娱乐活动,字牌的组合千变万化。汉字的组合也是变化多端,麻将这个项目希望能从汉字组合中发现汉语的秘密,为自然语言处理提供好的中文分词工具。 麻将是基于Scal
IKAnalyzer--Java分词必备工具(源码+bin),学习分词的或需要用Java分词的可以下来看看,支持Lucene
基于IKAnalyzer2012的分词小例子,支持中英文混合分词,例如T恤,可以从扩展词典里面加,也可以从代码里面自定义配置,下载直接导入到Ecliplse直接可以运行
solr默认没有中文分词功能,需要自己配置中文分词插件,这个ik-analyzer-8.3.0.jar完美集成
IK 分词器源码 此版本IK Analyzer 2012FF版,支持4Lucene.0以上 , 适合大家学习,开发自己的分词器,或参与该项目开发
IKAnalyzer分词器7.x版,可用于Lucene或Solr的7.x.x版本。
目前比较好用的分词器是IK2012年停更只支持到Lucene4.7,但是有些程序需要使用Lucene高版本,比如,Solr5.5就需要Lucene5.5.4来支持
说明:依赖jar包:lucene-core-2.3.2.jar、IKAnalyzer3.2.8.jar。一、LuceneUtil工具类代码:packagecom.zcm.lucene;importja
IK中文分词器,solr配置用jar包,适用于solr5版本,欢迎下载。。。