CLUE:中文语言理解基准测评中文语言理解评估基准:数据集基线预训练模型语料库和页首横幅源码

qqtriangle89388 5 0 ZIP 2021-02-08 09:02:26

CLUE基准数据集,基线,预训练模型,语料库和页首横幅中文语言理解测评基准,包括预期的数据集,基准(预训练)模型,语料库,排行榜。我们会选择一系列有一定预期的任务对应的数据集,做为我们测试基准的数据集。这些数据集会覆盖不同的任务,数据量,任务缺陷。更新: 中文任务测评基准(CLUE基准)-排行榜排行榜会定期更新数据来源: 分类任务(v1版本,正式版) 模型得分参数空军质量管理委员会新闻 IFLYTEK' 中国移动通信网世界标准委员会 CSL 68.77 108M 73.70 56.58 60.29 79.69 62.0 80.36 68.75 108M

文件列表

CLUE：中文语言理解基准测评中文语言理解评估基准：数据集，基线，预训练模型，语料库和页首横幅 (预估有个377文件)

.gitignore 162B

.gitignore 1KB

predicting_movie_reviews_with_bert_on_tf_hub.ipynb 65KB

.gitignore 1KB

predicting_movie_reviews_with_bert_on_tf_hub.ipynb 65KB

.gitignore 1KB

用户评论

暂无评论

人民日报中文分词语料库

采用人民日报标准语料库中文分词可以用到，或做其他中文学术研究

39 2018-12-08
复旦中文文本分类语料库.zip

本语料库由复旦大学李荣陆提供。test_corpus.rar为测试语料,共9833篇文档;train_corpus.rar为训练语料,共9804篇文档,两个预料各分为20个相同类别。训练语料和测试语料

16 2020-08-30
英文中文机器翻译语料库

英文-中文的一个文件,大约有两万个句子对,每一个句子对是(英文,中文),文件不大,主要用来做中英的机器翻译。

7 2020-08-30
用来中文分词评测用的北大语料库

北大98年1月份语料库迈向/v充满/v希望/n的/u新/a世纪/n

20 2020-05-23
中文文本分类_新闻语料库.zip

做毕设自用的中文新闻文本分类语料库，整理自搜狗新闻和清华新闻语料，共八个类别，每类已分好4000条训练集和1000条测试集。附赠一份停用词表，综合了哈工大停用词及川大停用词。

19 2020-05-26
灵玖LJCorpus中文语料库分析软件

语料库语言学是20世纪80年代才崭露头角的一门交叉学科，它研究自然语言文本的采集、存储、加工和统计分析，目的是凭借大规模语料库提供的客观翔实的语言证据来从事语言学研究和指导自然语言信息处理系统的开发。

68 2019-02-16
搜狗中文文本分析语料库

搜狗实验室新闻数据精简版，将xml文本进行处理后分类如下：奥运5595个txt房产14695个txt互联网2200个txt健康1153个txt教育2075个txt军事593个txt旅游1802个txt

30 2019-05-15
分词词性标注词典中文语料库.zip

分类_分词@12大类5485文本1127万_搜狗.20151022各种词库用语分词、词性标注等自然语言处理NLP任务

48 2019-07-25
大型语言模型垂直领域能力测评数据集详解

为了深入了解大型语言模型在特定领域的垂直性能，我们需要仔细分析其基础能力的验证数据集。随着ChatGPT发布后，大量大型模型团队和产品纷纷涌现。作为开发者，我们通常需要通过一些提示语进行实际试验，将它

61 2023-11-30
PLMpapers关于预训练语言模型的必读论文源码

PLM文件和贡献。介绍预先训练的语言模型(PLM)是NLP中非常受欢迎的主题。在此仓库中,我们列出了一些有关PLM的代表性工作,并通过图表显示了它们之间的关系。随时分发或使用它! 如果要在演

6 2021-04-04

CLUE:中文语言理解基准测评中文语言理解评估基准:数据集基线预训练模型语料库和页首横幅 源码

文件列表

用户评论

推荐下载

CLUE:中文语言理解基准测评中文语言理解评估基准:数据集基线预训练模型语料库和页首横幅源码