C++编写的词频分析器,输入文本记录单词出现频率!
用c语言编写的机器语言中的删除词性以及词性标记的工具
因工作需要,最近在做自然语言处理方面的研究,第一步需要实现中文分词,市面上有许多开源的分词组件,本人使用的是word分词,但这些开源组件中的词库都比较小,因此这段时间主要是在网上爬了各种词库,并通过X
该敏感词库包含:暴恐词库、反动词库、贪腐词库、民生词库、色情词库、其他不便分类的敏感词库
添加搜狗词库(更新部分)到自己的五笔词库中,让五笔词库更完善.下载分享.rar文件
使用说明:本软件适用于将常用汉语词组(如单位名称、员工姓名)等批量生成为汉字拼音,以文本词库形式存放在桌面上,用户可将生成的文本词库导入到搜狗拼音输入法中,实现快速输入。例如:兰州大学,生成词库导入后
使用五笔到搜狗五字词汇转换工具,生成搜狗五笔格式的五字词汇。适用版本: 极限五笔 6.5,搜狗五笔 2.0 使用方法: 首先在极限五笔中将词库导出为 TXT 文件, 然后在这个程序中把它转换成搜狗五笔
目前中文词频统计软件能够用的非常少,这款算是挺不错的了。找了很久才找到。分享一下。
对存储在txt文本中的单词进行统计显示出出现频率最高的单词
基于javascript+Ajax的词频统计
用户评论