灵玖LJCorpus中文语料库分析软件
语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。随着互联网的爆炸式增长,中文语料库的规模也随之剧增。语言学的研究面临着各类复杂的海量数据,亟需采用信息化的手段,自动分析相关的语言数据,从而更好地研究并开发使用的自然语言信息处理系统。
用户评论
推荐下载
-
分词库和语料库.zip
人民日报2014语料库和很多行业的中文分词库,如财经,地点,电视剧,电影等。如果有需要的可以在此处下载哦。
23 2020-05-19 -
英文词性标注语料库
英文分词语料库,共有198796行,每个单词都有词性标注,对句话的结束都有句号,便于处理。覆盖大部分主流行业的语料。例如:Newsweek/NNP,/,trying/VBGto/TOkee
136 2020-05-15 -
casia汉语情感语料库.zip
该数据库(http://www.chineseldc.org/resource_info.php?rid=76)由中国科学院自动化研究所录制,由4位录音人(2男2女)在纯净录音环境下(信噪比约为35d
34 2020-06-20 -
语料库的赋码工具
(1)显示赋码首字母,如名词以N开头、动词以V开头。 (2)包含特定赋码首字母的各种语言特征。 (3)用户自定义的各种语言特征,如被动语态等。 (4)显示所选语言特征的正则表达式,用户也可在此编辑表达
37 2019-02-16 -
小黄鸡_未分词_语料库
来源于人人网小黄鸡语料库,经过一部分处理后,但是并没有分词,可以用于对于中文的常用对话系统训练,也可以进行普通的中文自然语言处理。
60 2019-02-19 -
搜狗分类分词语料库
里面是2015年搜狗新闻,根据12大学科分类的中文分词资源,包含1127万字。
49 2019-03-13 -
自然语言处理语料库
上学期自己下载的新闻,新闻时间是在2009年12月末
40 2019-03-14 -
复旦新闻语料库训练集
复旦大学新闻语料库,此为训练集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
59 2019-03-08 -
英语简历语料库原始文本
里面有2万字左右的小型简历文本语料库资源,属于应用型文本,供学习和科研使用。
48 2019-04-11 -
复旦新闻语料库测试集
复旦大学新闻语料库,此为测试集。使用请注明来源:复旦大学计算机信息与科学技术系国际数据库中心自然语言处理小组
51 2019-06-04
暂无评论