现代汉语语料库加工规范(pku)

hace42794 27 0 PDF 2020-08-09 05:08:01

北大计算语言学研究所从1992年开始进行汉语语料库的多级加工研究。第一步是对原始语料进行切分和词性标注。1994年制订了《现代汉语文本切分与词性标注规范V1.0》。几年来已完成了约60万字语料的切分与标注,并在短语自动识别、树库构建等方向上进行了探索。在积累了长期的实践经验之后,最近又进行了《人民日报》语料加工的实验。为了保证大规模语料加工这一项重要的语言工程的顺利进行,北大计算语言学研究所于1998年10月制订了《现代汉语文本切分与词性标注规范V2.0》(征求意见稿)。因这次加工的任务超出词语切分与词性标注的范围,故将新版的规范改名为《现代汉语语料库加工规范》。

用户评论

暂无评论

搜狗中文语料库

搜狗中文语料库，涉及运动休闲、人文科学、生活百科、艺术设计、医学医药等十大领域。

96 2019-05-17
COCA美国当代语料库

COCA美国当代语料库，美国人日常生活中所有接触的文字信息处理后提取出来的最高使用频率的单词表。

42 2019-05-19
AntConc语料库检索软件

使用简单，功能很全。ntConc是一款跨平台（即Windows、Linux与苹果电脑都有对应版本）的语料库分析统计软件，由日本学者LaurenceAnthony博士从2002年研发至今，历时13年的历

21 2019-05-21
语料库标注工具SUTDAnnotator

语料库标注工具SUTDAnnotator，研究自然语言处理的同学推荐使用。

41 2019-05-14
酒店领域评语语料库

用于情感分析案例的语料库，亲测有效。积极、消极各5000条数据。

23 2019-07-10
TFIDF java实现语料库

TFIDF java实现可运行多文件语料库亲测可行语料库为《人民日报》相关权威新闻

34 2018-12-17
reuters21578语料库

reuters21578语料库，是文本挖掘必备的语料库。本人专业为文本挖掘，欢迎同行交流分享经验。

19 2019-07-24
中英平行语料库.zip

中英文平行语料库，用于机器翻译，问答系统等模型的预处理语料

36 2019-09-09
Reuters21578语料库

这是本人在做自然语言处理使用到的一个语料库，后期也会同步与大家共享资源

19 2019-01-06
wiki中文语料库

维基中文语料库，大小1.6G，所以上传到百度云，之前在csdn找了很久都没找到，只好自己翻墙去下载

50 2019-01-09

现代汉语语料库加工规范(pku)

用户评论

推荐下载