covid twitter bert:用于分析COVID 19 Twitter数据的预训练BERT模型 源码
COVID-Twitter-BERT COVID-Twitter-BERT(CT-BERT)是基于变压器的模型,该模型在有关COVID-19的大量Twitter消息集上进行了预训练。 v2模型在9700万条推文上进行了训练(1.2B训练示例)。 当在特定领域的数据集上使用时,我们的评估表明,与标准BERT-Large模型相比,该模型的边际性能提高了10–30%。 大多数改进都显示在与COVID-19相关的内容以及类似Twitter的消息中。 该存储库包含所有代码以及对和笔记本中使用的模型和数据集的引用,以对您自己的数据集上的CT-BERT进行微调。 如果您最终使用我们的作品,请引用:
文件列表
covid-twitter-bert-master.zip
(预估有个63文件)
covid-twitter-bert-master
sync_bucket_data.py
3KB
report
v1
main.tex
22KB
arxiv.sty
7KB
main.pdf
81KB
refs.bib
4KB
fig1.pdf
14KB
fig2.pdf
20KB
暂无评论