covid twitter bert:用于分析COVID 19 Twitter数据的预训练BERT模型 源码

rendering_47932 23 0 ZIP 2021-03-06 18:03:38

COVID-Twitter-BERT COVID-Twitter-BERT(CT-BERT)是基于变压器的模型,该模型在有关COVID-19的大量Twitter消息集上进行了预训练。 v2模型在9700万条推文上进行了训练(1.2B训练示例)。 当在特定领域的数据集上使用时,我们的评估表明,与标准BERT-Large模型相比,该模型的边际性能提高了10–30%。 大多数改进都显示在与COVID-19相关的内容以及类似Twitter的消息中。 该存储库包含所有代码以及对和笔记本中使用的模型和数据集的引用,以对您自己的数据集上的CT-BERT进行微调。 如果您最终使用我们的作品,请引用:

用户评论
请输入评论内容
评分:
暂无评论