COVID-19聊天机器人 请注意,聊天机器人生成的健康信息仅用于一般研究目的。 它不是诊断工具,也不是针对特定状况的医学建议或治疗的替代品。 目录 纸 我们的工作已被接受。 可以找到该文件 。 数据集 该数据集是取自的初始商业用途子集,包含9000篇学术文章。 出于培训目的,我们提取了这些文章的摘要和正文,并将它们合并在一起。 要(重新)提取数据,请运行以下命令。 python3 extract.py 模型 我们已经使用COVID-19语料库对GPT-2 774M模型进行了重新训练。 使用Adam优化器对模型进行了训练,学习率为0.0001。 它经过2500次迭代,批处理大小为8。