COVID-19阿拉伯文字嵌入 我们利用从2020年1月到2020年4月的收集的整个COVID-19数据集构建了单词向量模型。 通过删除转发和重复的推文,我们最终获得了2,821,940条推文。 我们考虑两种值得注意的词嵌入生成方法:word2vec和FastText。 使用这些特定于域的预训练词嵌入模型(COVID-19)将比在AI任务中使用其他通用的预训练词嵌入模型更为准确。 引文 如果您想使用我们的预训练模型,请使用以下bibtext引用此工作: @article{alqurashi2021eating, title={Eating Garlic Prevents COVID-19 Infection: Detecting Misinformation on the Arabic Content of Twitter}, author={Alqurashi, Sarah a