毕设论文基于词典的中文分词器
2010年毕业写的基于词典的分词器方案论文,不舍得丢,传上来给大家参考。自己合成了词库,使用了隐马尔科夫模型,分词质量还行。本文在对已有分词技术研究的基础上,做出了多处改进,完成了一个高效、准确的中文分词器,能进行文本和文件的分词操作。分词词典是分词器的基础,本文选择了查询速度极快的双数组Trie为基础,改进为“三数组Trie”,从而能够存储分词所需的词频词性信息;双向最大匹配切分算法具有快速、简单和较强的歧义检测能力等特点,通过动态的改变最大匹配长度,有效减少了匹配的平均次数并且对长词实现了无遗漏切分;歧义消解一直是影响分词精度的因素之一,本文通过改进MMSEG算法,采用了并行规则积分过滤的方法,达到了较好的效果;命名实体作为一类占比重最大的未登录词,
推荐下载
-
jieba分词器字典
jieba分词器所用的字典,包含词频以及词性,可自行调整频次等属性。(仅做学习交流用,禁止商用)
90 2019-05-02 -
Solr java分词器
NULL 博文链接:https://hui-jing-880210.iteye.com/blog/2174532
15 2020-09-21 -
IKAnalyzer IK分词器
文件目录:docIKAnalyzer2012FF_u1.jarIKAnalyzer.cfg.xmlIKAnalyzer中文分词器V2012_FF使用手册.pdfLICENSE.txtNOTICE.tx
30 2019-09-23 -
ik分词器551
各个版本ik分词器zip,下载解压即可使用..........................
24 2019-01-13 -
paoding分词器源码
paoding分词器源码,lucene适配开源分词器
13 2020-06-08 -
ik分词器文档
ik分词器的搭建.
20 2020-07-19 -
IK分词器通过spark加载词典并在spark中使用
IK分词器通过spark加载词典,并在spark中使用
5 2021-04-16 -
支持solr530的IKAnalyzer中文分词器
IKAnalyzer中文分词器本身已经不支持最新的solr 5,集成到solr中分词会报错,这里将解决了solr 5支持问题的最新IK包共享出来,希望能帮到各位! 附上IK在schema.xml中的配
35 2019-01-23 -
solr5的ik中文分词器源码
solr5的ik中文分词器源码,解压后需要自己打包成jar包
18 2020-09-27 -
ASP毕设论文
毕业论文参考,很不错噢
22 2019-07-29
用户评论