ML_for_SLA:训练神经网络以将可理解的输入与非结构化文本隔离以帮助词汇习得源码

come36055 0 0 ZIP 2021-04-18 09:04:01

通过机器学习优化二语词汇习得 “ i + 1”和掩蔽语言模型相遇的地方抽象的订阅“句子挖掘”->间隔重复系统(SRS)抽认卡范例的许多人遇到的瓶颈是寻找高质量抽认卡材料所涉及的手动工作。这项工作概述了一种从非结构化文本大规模无监督地生产高质量抽认卡材料的方法。该方法涉及训练轻量级的掩蔽语言模型,并且已在日本社交媒体和英语ArXiv论文上进行了小规模(20,000个单词)的应用。可以免费下载超过一百万个日语抽认卡,它们显示了11,000个单词(每个单词100个示例)。它将在将来的版本中扩大规模。简介/概述问题定义作为高级语言学习者并坚持使用“句子挖掘”->间隔重复系统(SRS)

文件列表

ML_for_SLA-master.zip (预估有个36文件)

ML_for_SLA-master

README.md 47KB

LICENSE 34KB

src

dev.py 779B

statics

DictionaryBuilder.py 1KB

DocumentResampler.py 745B

ByteNetEncoder.py 2KB

DatasetEncoder.py 2KB

__init__.py 0B

CharacterBuilder.py 700B

TokenLearner.py 4KB

concrete

jxTokenizer.py 2KB

jpTokenizer.py 238B

SequenceTagger.py 3KB

SampleBouncer.py 635B

ContextualEmbeddingsPreTrainingDataGenerator.py 3KB

interfaces

AbstractGenerator.py 197B

AbstractTokenizer.py 195B

dags

TrainingDataPrepPipeline.py 2KB

Stage 1 - Comment Selection.py 1KB

train a model and do some inference.py 2KB

edict.utf8.xz 3.82MB

BasicSRS

copy contexts.db.xz from data dir and unzip 0B

frequency.db 2.02MB

BasicSRS.py 11KB

edict.db.xz 3.82MB

tokens.db 157KB

audit.py 891B

images

idcnn_strubell.png 140KB

basic_srs.png 82KB

basic_srs_def_mode.png 31KB

char_lvl_design_ppl.png 74KB

char_lvl_design_auc.png 88KB

auc_ppl_final.png 38KB

receptive_field.png 43KB

data

contexts.db.xz 134B

.gitattributes 51B

用户评论

暂无评论

Python用pytorch预训练的神经网络

用pytorch预训练的神经网络:NASNet,ResNeXt,ResNet,InceptionV4,InceptionResnetV2,Xception,DPN等。

8 2020-10-14
神经网络实际训练中的问题.pdf

文档是个人在学习时翻译自MartinT.Hagan编著的《神经网络设计》第二版第22章。你的问题是否适合用神经网络解决？应该选择一个什么样的网络结构？如何去训练这个网络？训练的效果怎么样？对这些问题给

10 2020-04-29
神经网络训练样本选取的介绍

搭建好了神经网络而又忘记选择样本的同学们，这个文献还是有点用的哟

23 2019-09-06
简单的bp神经网络训练拟合代码

bp神经网络 newff train sim

27 2018-12-18
卷积神经网络的训练流程图

所用的方法是梯度下降（Gradientdescent）：通过使loss值向当前点对应梯度的反方向不断移动，来降低loss。一次移动多少是由学习速率（learningrate）来控制的。

53 2019-04-29
神经网络训练采用gpu设置的方式

在定义图结构之前不用加入gpu：0，只有在session中计算之前在加入，否则的话会提示不能使用gpu保存模型等问题。对于GPU来说，一定要注意的是，要分别在两个GPU上，或者不同时的在一个GPU上运

11 2021-07-03
Emogen训练后的神经网络权重文件

Emogen训练后的神经网络权重文件是用于进行情感分析和情感识别的关键组成部分。该文件经过训练和优化，包含了丰富的情感分类信息，可以直接应用于各类情感分析任务中。下载后，您可以轻松地将这些权重文件加载

22 2023-09-01
BP神经网络输入层数据归一化研究

研究了BP网络输入数据的归一化方法,提出了一种联合归一化的新方法,从而加快了网络的学习训练速度,提高了分类精度。在此基础上,建立了用于机械故障诊断的三层BP神经网络模型,编写了基于BP神经网络的故障诊

24 2019-07-23
adabnn与论文工作相关的代码AdaBnn经过自适应结构学习训练的二值化神经网络源码

阿达·本与论文工作相关的代码: “ AdaBnn:经过自适应结构学习训练的二值化神经网络” 该存储库当前包含两个协作笔记本: 带有实验性质的基于Keras实施AdaNet算法提出的由该文件实验“ ”

5 2021-02-07
BP神经网络的训练问题使用MATLAB实现BP神经网络的设计.pdf

BP神经网络的训练问题-使用MATLAB实现BP神经网络的设计.pdf 我自己编的神经网络,现在用Breiman的Plane数据集训练,10个输入,1个输出,33组数据,但是发现误差减小超级慢,而且到

25 2020-07-21

ML_for_SLA:训练神经网络以将可理解的输入与非结构化文本隔离以帮助词汇习得 源码

文件列表

用户评论

推荐下载

ML_for_SLA:训练神经网络以将可理解的输入与非结构化文本隔离以帮助词汇习得源码