推荐下载
-
复旦大学中文文本分类语料.xlsx
复旦大学中文文本分类语料.xlsx
84 2020-08-20 -
复旦中文文本分类语料库.zip
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料
16 2020-08-30 -
英文中文机器翻译语料库
英文-中文的一个文件,大约有两万个句子对,每一个句子对是(英文,中文),文件不大,主要用来做中英的机器翻译。
7 2020-08-30 -
Chinese NER data MSRA中文命名实体识别语料
中B-ORG共I-ORG中I-ORG央I-ORG致O中B-ORG国I-ORG致I-ORG公I-ORG党I-ORG十I-ORG一I-ORG大I-ORG的O贺O词O各O位
19 2020-05-23 -
用来中文分词评测用的北大语料库
北大98年1月份语料库迈向/v充满/v希望/n的/u新/a世纪/n
20 2020-05-23 -
中文文本分类_新闻语料库.zip
做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
19 2020-05-26 -
灵玖LJCorpus中文语料库分析软件
语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。
68 2019-02-16 -
人民的名义小硕分词后的中文语料
这是人民的名义 小硕,分词后的文本链接,主要参考了 一片博客,分词后贡献出来。
30 2019-02-17 -
中文文本分类语料_训练测试全集_复旦
本资源是复旦大学中文文本分类预料压缩包,包含训练与测试全集。
58 2018-12-25 -
搜狗中文文本分析语料库
搜狗实验室新闻数据精简版,将xml文本进行处理后分类如下:奥运5595个txt房产14695个txt互联网2200个txt健康1153个txt教育2075个txt军事593个txt旅游1802个txt
30 2019-05-15
用户评论