推荐下载
-
复旦中文文本分类语料库.zip
本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料
16 2020-08-30 -
英文中文机器翻译语料库
英文-中文的一个文件,大约有两万个句子对,每一个句子对是(英文,中文),文件不大,主要用来做中英的机器翻译。
7 2020-08-30 -
中文文本分类_新闻语料库.zip
做毕设自用的中文新闻文本分类语料库,整理自搜狗新闻和清华新闻语料,共八个类别,每类已分好4000条训练集和1000条测试集。附赠一份停用词表,综合了哈工大停用词及川大停用词。
19 2020-05-26 -
灵玖LJCorpus中文语料库分析软件
语料库语言学是20世纪80年代才崭露头角的一门交叉学科,它研究自然语言文本的采集、存储、加工和统计分析,目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。
68 2019-02-16 -
搜狗中文文本分析语料库
搜狗实验室新闻数据精简版,将xml文本进行处理后分类如下:奥运5595个txt房产14695个txt互联网2200个txt健康1153个txt教育2075个txt军事593个txt旅游1802个txt
30 2019-05-15 -
用于文本分类的语料库
分为10个类大概2000篇多文本,可用于文本分类的语料库
32 2020-01-05 -
Niek Sanders的Twitter情感语料库
在Twitter的情感分析数据集包含1,578,627条分类推文,每行标记为1表示积极情绪,0表示负面情绪。我建议使用1/10的语料库来测试你的算法,而其余的可以用来训练你用来分类情绪的任何算法
28 2019-06-01 -
机器翻译的语料库.docx
机器翻译的语料库.docx
14 2020-08-09 -
论文研究中文文本语料库分词一致性检验技术的初探.pdf
对大规模语料库中的分词不一致现象进行分析,提出了语料库分词一致性检查和校对的新方法。该方法提取词与词之间语法、语义搭配信息,利用支持向量机的理论对候选序列进行判断,给出一个切分结果,进而提高汉语语料库
4 2020-07-16 -
语料库与英语写作修改
如何科学有效的修改文章是师生迫切想要解决的问题。语料库资源丰富,操作简单,更新及时,正好弥补传统写作修改的不足。笔者试从理论和实践两方面来论证语料库在英语作文修改方面的有效成果。
7 2020-12-23
用户评论