C中文分词系统源码
简介 ChineseSplitter中文分词系统集成了单字(一元切分)、双字(二元切分)、词义切分等分词方法。提供很好的权重计算办法。 类结构 BaseSplitter(分词基类) │ ├─SingleSplitter(一元切分) │ ├─DoubleSplitter(二元切分) │ └─DefaultSplitter(词义切分)────NICTCLAS(中科院分词系统) KeywordsSort(关键字排序类) 不错的中文分词组件,带了语料库
推荐下载
-
中文分词系统ICTCLAS自评结果
中文 ICTCLAS自评结果 类别 数据 分词总数 1,168,459 分词正确数 1,147,791 分词正确率(按词统计) 98.231178% 上位词性标注正确率(按词统计) 95.526672
3 2020-11-17 -
几款开源的中文分词系统
中文分词是做好中文内容检索、文本分析的基础,主要应用于搜索引擎与数据挖掘领域。中文是以词为基本语素单位,而词与词之间并不像英语一样有空格来分隔,因而中文分词的难点在于如何准确而又快速地进行分词
17 2020-11-06 -
中文分词系统的设计与实现
这是一个基于JAVA的中文分词的系统,实现了正向最大匹配和逆向最大匹配,以及简单的歧义处理。
29 2018-12-17 -
ICTCLAS2009版中文分词系统
中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Ana
28 2018-12-29 -
中文分词演示系统跨平台论文
中文分词演示系统(跨平台)论文 主演介绍中文分词的实现方法与技术
21 2019-01-02 -
简单中文分词系统v1.0
这是一套基于词频词典的机械式中文分词引擎,它能将一整段的中文文本基本正确地切分成词。 词是中文的最小语素单位,但在书写时并不像英语会在词之间用空格分开, 所以如何准确并快速分词一直是中文分词的攻关难点
7 2020-07-23 -
日文分词系统mecab的中文讲解
日文分词系统mecab的中文讲解 mecab (http://mecab.sourceforge.net/) 是奈良先端科学技術大学院的工藤拓开发的日文分词系统, 该作者写过多个 machine le
14 2020-08-09 -
alice加入ik分词中文空格分词hanlp语义分词
Alice joins ik participle, Chinese space participle, hanlp semantic participle
51 2019-06-22 -
Lucene中文分词器极易分词
Lucene中文分词器中的极易分词组建,找了老长时间才弄下来的
33 2020-08-10 -
用于非监督中文分词算法的中文分词词库
用于非监督中文分词算法的中文分词词库
56 2019-06-05
用户评论