Chinese Transformer XL 源码

spatial_44891 20 0 ZIP 2021-04-04 16:04:09

中文-变形金刚-XL 正在施工:construction: 本项目提供了智源研究院“文汇”预训练模型中国变压器-XL的预训练和文本生成代码。数据本模型使用了智源研究院发布的中文预训练语料。具体地,我们使用了WuDaoCorpus中来自百度百科+搜狗百科(133G),知乎(131G),百度知道(38G)的语料,一共303GB数据。模型本模型使用了的训练目标,同时使用能够更好地处理长序列建模的替代了GPT中的Transformer。模型的结构与GPT-3 2.7B(32层,隐示尺寸2560 ,,每层32个关注头)的基本相同,因为Transformer-XL的结构尺寸,模型参数增加到了29亿。结果为了验证模型的生成能力,我们在中文的开放域长文问答上进行的评价。我们从上随机选择了100个不同领域的,没有训练语料中的问题。对每个问题,由人类测试成员对一个高层次数回答,3个模型生成的回答和3个生成的回答在

文件列表

Chinese-Transformer-XL-master.zip (预估有个80文件)

Chinese-Transformer-XL-master

docker

prepare.sh 753B

Dockerfile 10KB

ssh-env-config.sh 4KB

Dockerfile-cuda101 10KB

pretrain_bert.py 20KB

gpt2_data_loader.py 8KB

arguments.py 21KB

pretrain_gpt2.py 30KB

chinese_sentencepiece

cog-pretrain.model 998KB

cog-pretrain.vocab 706KB

fp16

loss_scaler.py 10KB

fp16util.py 8KB

__init__.py 941B

fp16.py 31KB

model

distributed.py 5KB

modeling.py 65KB

model.py 4KB

__init__.py 852B

gpt2_modeling.py 4KB

detokenizer.py 2KB

scripts

ds_pretrain_gpt2_2.9B.sh 2KB

ds_config_2.9B.json 850B

pretrain_gpt2_model_parallel.sh 1KB

generate_text.sh 964B

pretrain_gpt2_distributed.sh 1KB

ds_config.json 528B

ds_config_10B.json 846B

split_json.py 4KB

ds_checkpoint_check.sh 1KB

pretrain_gpt2.sh 780B

presplit_sentences_json.py 645B

ds_test_gpt2.sh 1KB

utils.py 15KB

configure_data.py 10KB

requirements.txt 272B

learning_rates.py 3KB

generate_samples.py 12KB

evaluate_perplexity.py 10KB

README.md 2KB

data_utils

file_utils.py 8KB

samplers.py 7KB

extraction.py 3KB

tokenization.py 40KB

sp_tokenizer.py 4KB

datasets.py 35KB

__init__.py 8KB

tokenization_gpt2.py 13KB

lazy_loader.py 8KB

tf_dl.py 5KB

wordpiece.py 15KB

corpora.py 12KB

mpu

data.py 4KB

initialize.py 5KB

utils.py 3KB

__init__.py 2KB

grads.py 3KB

transformer.py 35KB

mappings.py 4KB

layers.py 13KB

tests

test_initialize.py 3KB

test_random.py 7KB

test_data.py 3KB

test_layers.py 19KB

__init__.py 0B

commons.py 3KB

test_cross_entropy.py 4KB

cross_entropy.py 5KB

random.py 14KB

openwebtext

tokenizer.py 1KB

make_gpt2_sizes.py 982B

merge_jsons.py 2KB

group_duplicates_url.py 3KB

README.md 2KB

cleanup_dataset.py 4KB

run_make_gpt2_dataset.sh 234B

remove_group_duplicates.py 2KB

blacklist_urls.py 7KB

find_duplicates.py 4KB

make_gpt2_dataset.py 2KB

generation_utils.py 15KB

用户评论

暂无评论

暂无评论

zemax chinese

zemax-chinese 中文此版本ZEMAX 中文说明

17 2020-10-27
APK CHINESE

ALL TYPE FOR CELL . TRY IT YOUWLLLOVE IT .OK.

18 2020-10-18
PLI chinese

pl1PLI(chinese)

8 2020-09-11
Chinese Calligraphy

Chinese Calligraphy

18 2020-08-21
cics chinese

aboutcics

15 2020-04-30
chinese qq

chineseqqforwindows

15 2020-05-17
Chinese Takeaway

ChineseTakeaway

14 2020-05-15
pajek Chinese

pajek(Chinese)中文版的帮助,给大家共享下,多多下载哦

24 2020-12-10
UltraEdit Chinese

应用软件方便编程人员编写代码及处理日志等文件的信息。

27 2020-01-26
chinese chess

linux下中国象棋小游戏，属于原创。不过比较粗糙！

27 2020-07-18