360万中文词库+词性+词频
360万中文词库+词性+词频词典结构为:词语\t词性\t词频。
词频是用ansj分词对270G新闻语料进行分词统计词频获得。
本人感觉需要特别说明的是词典整理过程中存在部分词汇无法确定是什么词性,对词性进行特别标注:nw和comb
1、词性nw表示本身不知道是什么词性。
2、词性comb表示通过ansj的nlp分词之后又被拆成了两个词。
用户评论
推荐下载
-
中文分词及词性标注
java 词性标注
45 2018-12-25 -
中文分词与词性标注
成熟的中文分词系统,输入的训练文件比较特别。HMM技术。
39 2018-12-25 -
具有30万词条的词库
使用多个词典整合的,词频不是特别准。但是能满足一般的需求,还有词频和词性
41 2018-12-09 -
1.3万伪原创近义词库
最新的伪原创词库下载。seo优化利器
14 2021-01-03 -
常用汉字2.5万拼音词库
常用汉字拼音词库,包括多音字,全拼词库。
89 2020-09-11 -
2017最新整理71.6万词库
2017最新整理71.6万词库,适用于 elasticsearch 的 IK分词,解决搜索结果包含相关度低的稿件 解决方法: 1.丰富分词词库(由27.5万词,增加到71.6万词) 2.建索引时采用i
46 2018-12-07 -
海峰9.5_866万词库
海峰86_6.5万极点词库,在极点输入法点右键,管理工具→词库工具→词库生成与维护,点击[系统词库]中的“生成词库”,会生成极点码表,会弹出一个界面提示:系统词库创建完毕,用其替换现码表吗?点击是,替
17 2020-07-27 -
10万单词库txt版本
103976条数据,已处理完美,方便开发集成,别的版本有一些多余的冒号,我这版本已去除,可自行用数据库工具导入数据库,也可通过数据库工具导成其他格式,如txt,csv;或者下载我的其他对应格式的资源
28 2020-08-16 -
字词频统计和切分词工具词性标注工具用于分词管理
字词频统计和切分词工具(词性标注工具,用于分词管理),两个工具,支持单文件和目录处理。
28 2019-05-25 -
中文分词词库
使用中文分词的基准库 方便采用机械分词差分词库和搜索引擎使用 还使用在广告精确定投、推进引擎上
106 2019-02-21
暂无评论