BabyBERTa:针对儿童的语音训练和评估BERT 源码

sunshine96055 4 0 ZIP 2021-04-25 13:04:08

关于该存储库包含研究代码,用于测试在以儿童为导向的小型语料库中训练的RoBERTA小模型(来自美国英语儿童的5M个单词)。我们的模型是使用transformers Python包实现的,该包由huggingface维护。历史 2020年(Spring):BabyBERTa项目源于Cynthia Fisher,Dan Roth,Michael Connor和Yael Gertner领导的BabySRL项目,可找到其发表的作品。对于定制(较小尺寸)版本的BERT的SRL和MLM联合培训没有多大益处,因此开始了对BERT获取语法知识的新研究。 2020年(秋季):我们发现,在大型数量协议任务上,针对类似BERT的小型变压器,一种在认知上更合理的MLM预训练策略在相同的大小的RoBERTa模型(在fairseq库中使用标准方法进行了训练)的性能优于同等大小的RoBERTa模型。 2021年

文件列表

BabyBERTa-master.zip (预估有个20文件)

BabyBERTa-master

babyberta

utils.py 3KB

job.py 8KB

dataset.py 13KB

io.py 4KB

configs.py 807B

probing.py 8KB

params.py 4KB

images

logo.png 8.89MB

scripts

probe_roberta_base.py 3KB

train_bbpe.py 1KB

create_sub_corpus.py 793B

probe_fairseq_roberta.py 5KB

official_implementation

train.py 5KB

probe.py 2KB

requirements.txt 172B

README.md 5KB

data

reference_vocab

encoder.json 114KB

vocab.bpe 66KB

tokenizers

roberta-base.json 1.29MB

.gitignore 84B

用户评论

暂无评论

预测模型深度学习相关的模型训练评估和预测相关代码

预测模型深度学习相关的模型训练评估和预测相关代码常用的深度学习模型训练评估和预测相关代码基于Tensorflow高阶API Estimator实现尽量做到可读性和通用性较好.部分模型子目录下有较详细的

8 2023-01-27
评估项目分析和评估工具源码

项目分析和评估工具使用基于DCF(折现现金流量)方法评估项目的功能。目前,已经实现了Datar–Mathews方法(DMM)和模糊清偿方法(FPOM)。这项工作正在进行中,几乎所有内容都可能发生

23 2021-02-19
大词汇的辨别训练进行语音识别

约翰霍普金斯大学自动语音识别系统kaldi

21 2019-06-01
Python按word2vec格式存储的BERT预训练模型

按word2vec格式存储的BERT预训练模型

12 2020-07-23
mnist训练和预测源码

该压缩文件主要是mnist手写数字识别代码，编程语言python。包含训练和预测源码。

22 2019-06-01
播音主持语音发声训练教程

本书对于播音主持专科层次和本科层次都较为适用，也可作为教育工作者、学生、演艺人员、公关人员、服务接待人员、汉语留学生及社会各阶层人士学习普通话、提高语言修养的参考用书。

141 2019-04-10
语音训练文件导出工具

语音识别训练导出工具~！！！！！！！！！！！！！！！

25 2019-06-01
sphinx中文语音训练手册

本文档介绍Sphinx4在Windows下的中文训练过程及注意事项，与本文档配套的是我自己的训练实例bergtrain和用到的软件。本文档编写日期2013-04-231、为什么要训练？sphinx4目

27 2019-07-16
BERT Article Recommender with Faiss BERT Fais推荐人源码

BERT-Article-Recommender-with-Faiss:BERT-Fais推荐人

8 2021-04-18
BERT pytorch Google AI2018BERT pytorch实施源码

伯特·比托奇 Google AI的2018 BERT的Pytorch实现,带有简单注释 BERT 2018 BERT:用于语言理解的深度双向变压器的预培训论文URL: : 介绍 Google AI的B

41 2021-02-18

BabyBERTa:针对儿童的语音训练和评估BERT 源码

文件列表

用户评论

推荐下载