IGN_analysis 项目幻灯片的。 该项目本质上有两个目标: 查看审稿人的作品是否反映了他们的分数 创建一些机器学习模型,以查看他们根据写作对分数的预测程度。 添加了一项附加任务,以查看是否可以使用GPT-2模型来生成合理的文本以供审阅,但这还没有完全完成。 对于收集数据和数据清理的网络爬虫,请查看 数据分析分为两个文件: 研究了我收集的原始文本的一些基本指标,即分数和文本长度。 我还进行了一些质量检查,以了解清理文本的效果如何。 在我使用TextBlob库为每个评论提供极性和情感评分。