本资源为提高英语论文写作效率而推荐的语料库软件AntConc,包含4.2.0版本的安装包、中文简明手册和示例图。软件简单易用,适用于科研小白。除了平时写论文,也可以用于学术研究和文学创作。
暂无评论
COCA美国当代语料库,美国人日常生活中所有接触的文字信息处理后提取出来的最高使用频率的单词表。
语料库标注工具SUTDAnnotator,研究自然语言处理的同学推荐使用。
《现代汉语语料库加工规范——词语切分与词性标注》词性标记
用于情感分析案例的语料库,亲测有效。积极、消极各5000条数据。
TFIDF java实现 可运行多文件语料库 亲测可行 语料库为《人民日报》相关权威新闻
reuters21578语料库,是文本挖掘必备的语料库。本人专业为文本挖掘,欢迎同行交流分享经验。
中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
CTB6汉语分词语料库,可以拿来做分词任务。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
这是本人在做自然语言处理使用到的一个语料库,后期也会同步与大家共享资源
维基中文语料库,大小1.6G,所以上传到百度云,之前在csdn找了很久都没找到,只好自己翻墙去下载
暂无评论