# 语料库训练
复旦新闻语料库训练集
复旦大学新闻语料库,此为训练集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
英语语料库LOB语料库
LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级:
Brown语料库和LOB语料库
Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000
复旦新闻语料库训练加测试
复旦大学新闻语料库,该版本已转为UTF-8格式,包含训练集和测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心
NLP文本分类语料库复旦语料训练集
NLP文本分类语料库(复旦)语料训练集
青云语料库
自然语言处理语料库,可以用于训练。对话质量较高,噪音相对较少,任然需要做一些处理。
语料库tccorpusanswer
作为训练使用的语料库
邮件语料库
用于邮件分类的语料库
语料库.zip
语料库资源里有网上购酒评论,分为积极评论与消极评论;
资源里还包括中文停用词1800+
英文语料库
用于英文分类的测试集和训练集应用,分词,去停用词处理