暂无评论
《现代汉语语料库加工规范——词语切分与词性标注》词性标记
用于情感分析案例的语料库,亲测有效。积极、消极各5000条数据。
TFIDF java实现 可运行多文件语料库 亲测可行 语料库为《人民日报》相关权威新闻
reuters21578语料库,是文本挖掘必备的语料库。本人专业为文本挖掘,欢迎同行交流分享经验。
CTB6汉语分词语料库,可以拿来做分词任务。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
这是本人在做自然语言处理使用到的一个语料库,后期也会同步与大家共享资源
维基中文语料库,大小1.6G,所以上传到百度云,之前在csdn找了很久都没找到,只好自己翻墙去下载
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料
TLBs:(TranslateLooksideBuffers,翻译旁视缓冲器)用于存储指令和输入/输出数值的区域。HL-PBGA:(表面黏著、高耐热、轻薄型塑胶球状矩阵封装)一种芯片封装形式。---
适用于国际地址三联,包含中英文,只有地址名称,其他邮编什么的没有。三联信息根据parentID关联
暂无评论