# 琴语言语料库
计算机语言语料库词典
这个资源包含了计算机行业的语料,便于中文分词
北京大学自然语言语料库
难以下载的北京大学自然语言处理语料库,适合分词,词性标注!
英语语料库LOB语料库
LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级:
Brown语料库和LOB语料库
Brown语料库是世界上第一个计算机可读的语料库,它搜集的语料来自1961年美国英语出版物上的文本,共500篇,每篇大约2000
自然语言处理语料库
上学期自己下载的新闻,新闻时间是在2009年12月末
COCA语料库
COCA20000高频词汇。COCA=CorpusofContemporaryAmericanEnglish(COCA)这是英语
ohsumed语料库
OHSUMED数据集合由WilliamHersh和他的同事们一起建立,其文档来源于医药信息数据库MEDLINE10,它包含了从1
NBCorpus语料库
NBCorpus英文语料库已近做好分词,但是未去除停用词。
新闻语料库
包含2015年一整年的新闻,文件以txt形式存储,是从各大网站上爬取下来的。希望喜欢
柏林语料库
是一个简单的情感语音库,德国柏林语料库