Jcseg是基于mmseg算法的Java中文分词器,提供关键字、短语、句子提取和自动摘要功能。还集成了Jetty服务器,方便http调用。支持最新版本的lucene、solr、elasticsearch和opensearch的搜索分词接口。
暂无评论
为您提供Jcseg中文分词器下载,Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器
jcseg 是使用 Java 开发的一款开源的中文分词器, 使用 mmseg 算法. 分词准确率高达 98.4%, 支持中文人名识别, 同义词匹配, 停止词过滤... Jcseg 详细功能介绍: (可
在网上找了好半天也没找到jcseg分词器对lucene3的支持,自己参考这对lucene4的支持写的,希望对大家有用。
非常好的中文分词器,基于lucene,很好用!
因为es本身的分词器对中文不是特别友好,所以使用ik分词器,分为两种模式,一种是粗模式,一种是细模式,还希望能帮助到刚刚接触的人
IK Analyzer 是一个开源的,基亍 java 语言开发的轻量级的中文分词工具包。从 2006 年 12 月推出 1.0 版开始, IKAnalyzer 已经推出了 4 个大版本。最初,它是以开
只需要解压然后启动tomcat即可访问solr服务器,需要自行在apache-tomcat-solr-7.0.52\webapps\solr\solrhome\collection1\conf\sch
scms 中文分词器,使用c实现,可以在linux环境下使用,分词的速度非常的快,可以用于一般的分词程序
这是一个分词器,基于开源的jar包。适用于二次开发。
用于Lucene当前新版本4.0以上在与IKAnalyzer一同使用使用冲突报错。 运行之后发现异常:Exceptioninthread"main"java.lang.VerifyError:clas
暂无评论