# 语料库训练模型
复旦新闻语料库训练集
复旦大学新闻语料库,此为训练集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
英语语料库LOB语料库
LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级:
Brown语料库和LOB语料库
Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000
复旦新闻语料库训练加测试
复旦大学新闻语料库,该版本已转为UTF-8格式,包含训练集和测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心
NLP文本分类语料库复旦语料训练集
NLP文本分类语料库(复旦)语料训练集
COCA语料库
COCA20000高频词汇。COCA=CorpusofContemporaryAmericanEnglish(COCA)这是英语
ohsumed语料库
OHSUMED数据集合由WilliamHersh和他的同事们一起建立,其文档来源于医药信息数据库MEDLINE10,它包含了从1
NBCorpus语料库
NBCorpus英文语料库已近做好分词,但是未去除停用词。
新闻语料库
包含2015年一整年的新闻,文件以txt形式存储,是从各大网站上爬取下来的。希望喜欢
柏林语料库
是一个简单的情感语音库,德国柏林语料库