里面有2万字左右的小型简历文本语料库资源,属于应用型文本,供学习和科研使用。
复旦大学新闻语料库,此为测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
商城手机评论文本,华为荣耀手机(2款手机评论文本),小米红米手机,OPPO手机各1000条,共4000条。可作为中文分类的训练语料库,用于情感分析,推荐系统等领域。最新的评论资源。
语料库通用技术平台Inspire1主要包括语料采集、语料加工、语料统计和语料检索等四大功能
语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。
让需要的人可以更容易找到吧,只是不知道传的会不会有问题试试。。。。
美国当代英语语料库COCA20000条,试着来挑战一下吧。
搜狗文本分类语料库
Corpus WordSmith translation research use
截取了内容的一部分:M“/想要/成为/一名/伟大/的/战士/,/就/必须/从小/刻苦/锻炼/。/”/EM“/你们/都/是/普通人/,/不/可能/像/那些/大/贵族/一样/有/厉害/的/斗/气密/典/修