暂无评论
语料库中文中文语料库复旦大学
相对比较完整的中文语料库,用于中文本分类的训练预料
搜狗语料库,自己用结巴分词分好的。(为什么摘要必须大于50个字)
语言所公开的现代汉语语料库,通过分别查询3500个常用汉字,将所有数据进行清洗去重后的集合。共554026行,解压后约93.8M,带分词和词性标注。
中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
CTB6汉语分词语料库,可以拿来做分词任务。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
这是本人在做自然语言处理使用到的一个语料库,后期也会同步与大家共享资源
维基中文语料库,大小1.6G,所以上传到百度云,之前在csdn找了很久都没找到,只好自己翻墙去下载
随着学术界对外宣研究的逐渐升温,其研究成果如雨后春笋般呈现。通过对中国知网关于外宣相关研究成果的检索,发现学术文献中外宣的英文对应词多达14个。其中,"propaganda"和&q
搜狗W ,是搜狗的语料中的东西,下着研究看看吧,应该用用
暂无评论