biobert master.zip
BioBERT:用于生物医学文本挖掘的预训练生物医学语言表示模型。随着生物医学文献数量的快速增长,生物医学文本挖掘变得越来越重要。随着自然语言处理(NLP)的进步,从生物医学文献中提取有价值的信息已在研究人员中受到欢迎,深度学习促进了有效的生物医学文本挖掘模型的发展。但是,由于单词分布从普通领域的语料库转移到生物医学的语料库,直接将NLP的进步应用到生物医学的文本挖掘中常常会产生不令人满意的结果。在本文中,我们研究了最近引入的预训练语言模型BERT如何适用于生物医学语料库。我们介绍了BioBERT(用于生物医学文本挖掘的变压器的双向编码器表示),这是在大型生物医学语料库上预先训练的领域特定语言
文件列表
biobert-master.zip
(预估有个25文件)
biobert-master
tf_metrics.py
8KB
tokenization.py
12KB
run_classifier.py
34KB
run_ner.py
26KB
run_pretraining.py
18KB
create_pretraining_data.py
15KB
modeling.py
37KB
biocodes
transform_nbset2bioasqform.py
3KB
暂无评论