siatl:NAACL 2019论文的PyTorch源代码“从预训练的语言模型进行迁移学习的令人尴尬的简单方法” Source code learning

litre98319 6 0 ZIP 2021-04-18 02:04:32

此存储库包含NAACL 2019论文“从预训练的语言模型进行学习的尴尬简单方法”的源代码介绍本文提出了一种简单的转移学习方法,用于解决灾难性遗忘问题。我们预先训练语言模型,然后将其转移到新模型,并在其中添加循环层和注意机制。基于多任务学习,我们使用损失的加权总和(语言模型损失和分类损失),并在(分类)任务上微调预训练模型。建筑学第一步: 基于LSTM的单词级语言模型的预训练第二步: 在分类任务上微调语言模型(LM) 使用辅助LM损耗使用2个不同的优化器(1个用于预训练零件,1个用于新添加零件) 依次解冻参考 @inproceedings{chronopoulou-etal-2019-embarrassingly, title = "An Embarrassingly Simple Approach for Transfer Learning from P

文件列表

siatl-master.zip (预估有个36文件)

siatl-master

README.md 4KB

utils

nlp.py 1KB

config.py 1KB

transfer.py 828B

logging.py 1KB

datasets.py 11KB

data_parsing.py 4KB

opts.py 1KB

training.py 2KB

early_stopping.py 1KB

logger

plotting.py 3KB

__init__.py 0B

helpers.py 809B

experiment.py 10KB

datasets

SCv2-GEN

raw.pickle 844KB

models

sent_lm.py 5KB

sent_clf_no_aux_trainer.py 8KB

sent_clf.py 8KB

sent_lm_trainer.py 468B

run_clf.py 1KB

sent_clf_trainer.py 7KB

sent_clf_no_aux.py 8KB

checkpoints

.gitkeep 0B

requirements.txt 651B

modules

locked_dropout.py 442B

trainer.py 8KB

modules.py 17KB

embed_regularize.py 745B

helpers.py 881B

layers.py 4KB

.idea

deployment.xml 387B

sys_config.py 631B

images

siatl.png 135KB

model_configs

SCV2_naive_att_gu.yaml 527B

lm_20m_word.yaml 387B

SCV2_aux_ft_gu.yaml 689B

用户评论

暂无评论

LMRS ICLR2020论文的源代码Search source code

LMRS:学习的流形随机搜索该代码存储库包含的源代码: Learning to Guide Random Search Ozan Sener, Vladlen Koltun Internationa

9 2021-04-25
moser服务于机器学习模型的简单方法源码

Moser:模型服务器原型 Moser是服务于机器学习模型的简单方法。 Moser的目标是超级轻松地在生产服务器中设置任何类型的预测模型,并能够通过RESTful API调用与其进行交互。产品特点

4 2021-02-07
sawyer robot learning在Sawyer Robot上应用机器学习的仿真源代码和示例Source code learning

索耶机器人学习该存储库包含模拟源代码和在凉亭模拟环境中在上应用机器学习算法的示例。依赖项和软件包: 包括Sawyer机器人模型和模拟器软件包,用于在凉亭环境中访问Sawyer机器人。 Python

6 2021-04-06
MNIST预训练模型.pth文件的使用方法

本文将详细介绍如何使用MNIST预训练模型.pth文件进行FGSM的白盒测试，包括模型导入、数据准备和测试输出等步骤。同时提供了常见问题解答和技巧建议，帮助用户提高测试效率和结果准确率。

7 2023-06-15
hippo dockerizer source https的源代码docker source code

hippo-dockerizer-源源代码

7 2021-04-20
code smells从Java源代码检测有害代码气味的项目java project source code

代码气味从Java源代码检测有害代码气味的项目我创建了这个项目,以使用访问者模式对JavaParser的AST导航进行实验。我正在创建有关代码气味的Pro Gradu,因此我决定对一些简单的代码

17 2021-04-21
cesm_code cesm的源代码ce source code

cesm_code:cesm的源代码

11 2021-04-04
Strimoid Strm的源代码docker source code

条纹状源代码,全新的社交服务。 API文档您可以在找到API文档。如何开始如果尚未安装和docker-compose,则需要安装它们。 docker-compose up -d --build

10 2021-04-04
CardioCritterSource CardioCritters的源代码Car source code

CardioCritterSource:CardioCritters的源代码

6 2021-04-18
AdaCare AdaCare的源代码Car source code

AdaCare:可通过比例自适应特征提取和重新校准进行的可解释的临床健康状况表示学习 AdaCare的源代码:通过比例自适应特征提取和重新校准的可解释的临床健康状况表示学习可视化欢迎测试我们的可视

11 2021-04-18

siatl:NAACL 2019论文的PyTorch源代码“从预训练的语言模型进行迁移学习的令人尴尬的简单方法” Source code learning

文件列表

用户评论

推荐下载