BIG bench:超越模仿游戏的协作基准适用于多种语言模型源码

qqexpensive44375 12 0 ZIP 2021-04-04 23:04:29

大台 :chair: 超越模仿游戏基准(BIG-bench)将是一个协作基准,旨在探究大型语言模型并推断其未来功能。我们邀请通过GitHub pull request将任务提交到该基准测试。所有接受任务的提交者都将作为共同作者纳入宣布基准的论文中。基准测试的初步结果也将在ICLR 2021的”进行介绍。Google和OpenAI的团队致力于评估BIG-Bench最佳性能模型体系结构,涉及数十种模型。数千到数千亿个参数。评估结果也将在研讨会上发布,并包含在相关论文中。我们还将通过其他组织的大型语言模型在基准上。我们会将贡献的基准测试结果包括在研讨会上宣布的结果以及相关的论文中。可以通过与基准组织者联系。提交时间表次决胜回合到期日描述 1个 2021年3月5日必须打开拉取请求,才有资格在研讨会上进行演示 1个 2021年3月26日上面的拉取请求必须合并 2个 2021年5

文件列表

BIG-bench-main.zip (预估有个68文件)

BIG-bench-main

setup.py 2KB

.gitignore 65B

keywords.md 5KB

requirements.txt 154B

.pre-commit-config.yaml 121B

LICENSE 11KB

setup.cfg 118B

.github

workflows

python-app.yml 791B

notebooks

colab_examples.ipynb 73KB

scripts

generate_api_docs.sh 180B

build_docker_image.sh 743B

evaluate_task.sh 167B

format_code.sh 151B

evaluate_task_docker.sh 195B

docker

Dockerfile 1KB

evaluate_task.py 3KB

download_models.py 2KB

build_docker_image.py 2KB

README.md 15KB

bigbench

api

conftest.py 876B

__init__.py 0B

task_metrics.py 4KB

json_task.py 13KB

test_util.py 1KB

task.py 6KB

util.py 4KB

test_tasks.py 8KB

model.py 3KB

evaluate_task.py 4KB

__init__.py 0B

benchmark_tasks

simple_arithmetic_json

task.json 2KB

README.md 658B

__init__.py 0B

simple_arithmetic

README.md 3KB

task.py 3KB

simple_arithmetic_json_multiple_choice

task.json 2KB

README.md 680B

simple_arithmetic_multiple_targets_json

task.json 898B

README.md 579B

README.md 152B

models

human_model.py 3KB

__init__.py 0B

dummy_model.py 2KB

huggingface_models.py 14KB

docs

0-shot-generative.png 21KB

2-shot-generative.png 46KB

code-of-conduct.md 4KB

html

bigbench

api

test_util.html 10KB

util.html 16KB

task.html 30KB

index.html 8KB

test_tasks.html 24KB

conftest.html 8KB

task_metrics.html 14KB

json_task.html 42KB

model.html 20KB

benchmark_tasks

simple_arithmetic

task.html 14KB

index.html 7KB

index.html 6KB

models

dummy_model.html 11KB

huggingface_models.html 34KB

index.html 7KB

evaluate_task.html 12KB

index.html 7KB

contributing.md 1KB

doc.md 25KB

Alan_Turing_Memorial_Sackville_Park_cropped.jpg 2.06MB

0-shot-scoring.png 40KB

用户评论

暂无评论

BannerView适用于Android的BannerView源码

BannerView Android版BannerView。从RecyclerView扩展。显示图像或文字。简单易用,易于扩展。屏幕截图入门步骤1.将其添加到存储库末尾的root buil

4 2021-02-08
jukewin适用于Windows的JUKE源码

适用于Windows的JUKE 描述这是一个正在进行的业余时间项目,由一个Jukebox应用程序组成。基本功能是: 将MP3文件添加到库中并保存该库让用户从库中排入歌曲(通过各种类型的UI) 使其

7 2021-04-26
WordPressAndroid适用于Android的WordPress源码

Android版WordPress 如果您只是想为Android安装WordPress,则可以在上找到它。如果您是想要贡献的开发人员,请继续阅读。制作说明确保已安装。使用“ (nvm)安装n

22 2021-02-06
Hubitat适用于HubitatElevation的应用源码

人居海拔应用程序/驱动程序适用于Hubitat Elevation Hub的应用程序。官方网站: 官方论坛: : 通过以下方式接受支持发展努力的捐款: 贝宝: : Venmo:Bryan-Turc

13 2021-05-11
Alertmanager适用于macOS的Alertmanager源码

适用于macOS的Alertmanager 适用于macOS的Alertmanager是一个小型macOS应用程序,可显示来自警报。您可以设置多个Alertmanager实例以从中检索警报。警报按

15 2021-04-26
GreenVue适用于退休的兽医源码

GreenVue:适用于退休的兽医

8 2021-04-06
OsmAndiOS适用于iOS的OsmAnd源码

OsmAnd-ios

18 2021-03-23
AcycoMod适用于1.14.4的AcycoMod源码

阿西科莫适用于1.14.4的AcycoMod 2020.01.06

4 2021-02-25
macfiles适用于macOS的Dotfiles源码

macfiles:适用于macOS的Dotfiles

11 2021-04-03

BIG bench:超越模仿游戏的协作基准适用于多种语言模型 源码

文件列表

用户评论

推荐下载

BIG bench:超越模仿游戏的协作基准适用于多种语言模型源码