KR BERT:基于KoRean的BERT预训练模型(KR BERT)用于Tensorflow和PyTorch 源码

lengthy3131 19 0 ZIP 2021-03-12 01:03:44

基于KoRean的Bert预先培训(KR-BERT) 这是首尔国立大学计算语言实验室开发的韩语专用,小规模BERT模型的发布,其性能可比或更高,并在引用。词汇,参数和数据多语言BERT (谷歌) 科伯特(ETRI) 科伯特(SKT) KR-BERT字符 KR-BERT子字符 vocab大小 119,547 30,797 8,002 16,424 12,367 参数大小 167,356,416 109,973,391 92,186,880 99,265,066 96,145,233 资料大小 -- (维基百科数据适用于104种语言) 23GB 4.7B语素 --

文件列表

KR-BERT-master.zip (预估有个93文件)

KR-BERT-master

README.md 9KB

krbert_tensorflow

tokenization.py 12KB

bert_config_subchar12367.json 313B

optimization.py 7KB

tokenization_ranked.py 15KB

vocab_char_16424.txt 101KB

bert_config_char16424.json 313B

models

.gitkeep 0B

.AppleDouble

.Parent 741B

run_classifier.py 30KB

vocab_subchar_12367.txt 173KB

data

char

test.tsv 4.71MB

train.tsv 12.22MB

dev.tsv 1.87MB

subchar

test.tsv 9.92MB

train.tsv 25.7MB

dev.tsv 3.93MB

modeling.py 37KB

krbert_pytorch

train.py 6KB

evaluate.py 3KB

model

net.py 924B

utils.py 9KB

__pycache__

__init__.cpython-36.pyc 127B

data.cpython-36.pyc 2KB

metric.cpython-36.pyc 2KB

.AppleDouble

.Parent 741B

net.cpython-36.pyc 8KB

utils.cpython-36.pyc 10KB

__init__.py 0B

.AppleDouble

.Parent 741B

net.py 741B

utils.py 741B

__init__.py 741B

data.py 741B

metric.py 741B

data.py 882B

metric.py 772B

utils.py 4KB

finetuning_config.json 124B

checkpoints

.gitkeep 2B

.AppleDouble

.Parent 741B

.gitkeep 741B

build_dataset.py 1009B

.AppleDouble

.Parent 741B

train.py 741B

evaluate.py 741B

utils.py 741B

finetuning_config.json 741B

build_dataset.py 741B

.DS_Store 741B

pretrained

config_subchar12367_bert.json 235B

tokenization.py 13KB

vocab_snu_subchar12367.txt 173KB

bert_config_subchar12367.json 340B

tokenization_ranked.py 15KB

config_char16424_bert.json 223B

bert_config_char16424.json 363B

vocab_snu_char16424.txt 101KB

config_char16424_old.json 222B

.AppleDouble

.Parent 741B

config_subchar12367_bert.json 741B

tokenization.py 741B

vocab_snu_subchar12367.txt 741B

bert_config_subchar12367.json 741B

tokenization_ranked.py 741B

config_char16424_bert.json 741B

bert_config_char16424.json 741B

vocab_snu_char16424.txt 741B

config_char16424_old.json 741B

vocab_snu_char16424.pkl 741B

config_char16424_ranked.json 741B

config_subchar12367_ranked.json 741B

vocab_snu_subchar12367.pkl 741B

config_subchar12367_old.json 741B

vocab_snu_char16424.pkl 373KB

config_char16424_ranked.json 225B

config_subchar12367_ranked.json 237B

vocab_snu_subchar12367.pkl 377KB

config_subchar12367_old.json 234B

.DS_Store 8KB

data

ratings_test.txt 4.67MB

test.txt 4.28MB

config.json 103B

ratings_train.txt 13.95MB

train.txt 10.23MB

.AppleDouble

.Parent 741B

ratings_test.txt 741B

test.txt 741B

config.json 741B

ratings_train.txt 741B

train.txt 741B

validation.txt 741B

validation.txt 2.57MB

用户评论

暂无评论

Bert_1810.04805.pdf

这是Bert的“印网”原版论文。资源描述必须写满50个字节。

13 2020-07-22
bert gen.pdf

大型的预训练语言模型可以编码大量的语言信息,但是却很难学习到数字推理之类的高级推理技巧,虽然现在也有很多涉及数字推理的模型,但是现有的模型都是使用专门的模块计算数值,并且将数值计算的空间限制在有限的范

12 2020-08-19
macan_bert_pb

macan_bert_pb

26 2021-01-30
Dureader Bert BERT Dureader多文档阅读理解排名第七源码

Dureader-Bert 2019 Dureader机器阅读理解单模型代码。哈工大讯飞联合实验室发布的中文全词覆盖BERT 只需将要加载的预训练模型换为压缩包内的chinese_wwm_pytor

9 2021-03-03
tf2bert一个使用tf2复现的bert模型库源码

tf2bert 一个使用tf2复现的bert模型库

11 2021-05-22
bert as service使用BERT模型将可变长度句子映射到固定长度向量源码

您在寻找X即服务吗? 试试! X可以是albert,pytorch-transformer,vgg,resnet,videobert或任何深度学习表示模型吗? •••• • 了解如何使用Jina通过任

24 2021-03-21
Google开源BERT模型源代码.pdf

[Objective]Thispapercomparesthepredictionaccuracyandefficiencyofdifferentmachinelearningalgorithms,

20 2020-06-08
深入解析人工智能bert模型

人工智能bert模型是一种基于深度学习的自然语言处理技术，利用了大量的语言语料库进行预训练，可以应用于多种文本任务，如文本分类、情感分析、问答等。本文将对bert模型的基本原理、预训练方式以及应用场景

26 2023-03-29
基于BERT的ASR纠错附件资源

基于BERT的ASR纠错-附件资源

7 2021-04-08
Theseus的BERT sailboat Theseus的官方PyTorch实施通过渐进式模块替换压缩BERT EMNLP2020源码

塞瑟斯·伯特论文代码。 The-theseus BERT是通过逐步替换原始BERT的组件而得到的新的压缩BERT。引文如果您在研究中使用此代码,请引用我们的论文: @inproceedings

4 2021-02-26

KR BERT:基于KoRean的BERT预训练模型(KR BERT)用于Tensorflow和PyTorch 源码

文件列表

用户评论

推荐下载