jcseg:Jcseg是用Java开发的轻量级NLP框架。 提供基于MMSEG算法的CJK和英语细分并基于TEXTRANK算法实现关键词提取关键句提取摘要提取。
Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键在于提取,关键句提取和文章自动摘要等功能,并提供了一个基于Jetty的web服务器,方便各大语言直接Jcseg自带了一个jcseg.properties文件用于快速配置而得到适合不同场合的分词应用,例如:最大匹配词长,是否开启中文人名识别,是否追加拼音,是否追加名词等! Jcseg核心功能: 中文分词:mmseg算法+ Jcseg独创的优化算法,七种切分模式。 关键字提取:基于textRank算法。 关键语法提取:基于textRank算法。 关键句子提取:基于textRank算法。 文章自动摘
文件列表
jcseg:Jcseg是用Java开发的轻量级NLP框架。 提供基于MMSEG算法的CJK和英语细分,并基于TEXTRANK算法实现关键词提取,关键句提取,摘要提取。 Jcseg具有内置的http服务器和用于最新lucene,solr,elasticsearch的搜索模块
(预估有个195文件)
.gitignore
207B
StringUtil.java
15KB
STConverter.java
17KB
TextRankSummaryExtractor.java
14KB
Entity.java
21KB
NLPSeg.java
36KB
SegmenterConfig.java
17KB
Segmenter.java
57KB
ADictionary.java
29KB
JcsegTest.java
18KB
暂无评论