CLUE基准 数据集,基线,预训练模型,语料库和页首横幅 中文语言理解测评基准,包括预期的数据集,基准(预训练)模型,语料库,排行榜。 我们会选择一系列有一定预期的任务对应的数据集,做为我们测试基准的数据集。这些数据集会覆盖不同的任务,数据量,任务缺陷。 更新: 中文任务测评基准(CLUE基准)-排行榜 排行榜会定期更新数据来源: 分类任务(v1版本,正式版) 模型 得分 参数 空军质量管理委员会 新闻 IFLYTEK' 中国移动通信网 世界标准委员会 CSL 68.77 108M 73.70 56.58 60.29 79.69 62.0 80.36 68.75 108M