# 语料库连接

英语语料库LOB语料库

LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级:
163 RAR 2018-12-07

Brown语料库和LOB语料库

Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000
52 RAR 2020-10-19

COCA语料库

COCA20000高频词汇。COCA=CorpusofContemporaryAmericanEnglish(COCA)这是英语
78 PDF 2019-05-25

ohsumed语料库

OHSUMED数据集合由WilliamHersh和他的同事们一起建立,其文档来源于医药信息数据库MEDLINE10,它包含了从1
99 GZ 2019-07-30

NBCorpus语料库

NBCorpus英文语料库已近做好分词,但是未去除停用词。
36 RAR 2019-07-30

新闻语料库

包含2015年一整年的新闻,文件以txt形式存储,是从各大网站上爬取下来的。希望喜欢
77 zip 2019-05-03

柏林语料库

是一个简单的情感语音库,德国柏林语料库
58 RAR 2019-04-16

青云语料库

自然语言处理语料库,可以用于训练。对话质量较高,噪音相对较少,任然需要做一些处理。
28 TSV 2020-05-31

语料库tccorpusanswer

作为训练使用的语料库
26 RAR 2020-05-14

邮件语料库

用于邮件分类的语料库
27 ZIP 2020-05-18