# 语料库连接
英语语料库LOB语料库
LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级:
Brown语料库和LOB语料库
Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000
COCA语料库
COCA20000高频词汇。COCA=CorpusofContemporaryAmericanEnglish(COCA)这是英语
ohsumed语料库
OHSUMED数据集合由WilliamHersh和他的同事们一起建立,其文档来源于医药信息数据库MEDLINE10,它包含了从1
NBCorpus语料库
NBCorpus英文语料库已近做好分词,但是未去除停用词。
新闻语料库
包含2015年一整年的新闻,文件以txt形式存储,是从各大网站上爬取下来的。希望喜欢
柏林语料库
是一个简单的情感语音库,德国柏林语料库
青云语料库
自然语言处理语料库,可以用于训练。对话质量较高,噪音相对较少,任然需要做一些处理。
语料库tccorpusanswer
作为训练使用的语料库
邮件语料库
用于邮件分类的语料库