Twitter气候变化情绪分析 -项目状态:有效 项目目标 该项目的目的是建立一个模型,将推文对人为气候变化的情绪进行分类。 我们也有兴趣研究气候变化情绪与每日全球地表温度之间的相关性。 使用方法 机器学习 数据可视化 数据清理 自然语言处理 技术领域 Python tweepy 大熊猫 scikit学习 朱皮特 项目描述 数据清理: 我们以标签开头的Kaggle数据集包含带有损坏文本的tweet,因此我们使用Tweepy通过tweet id访问所有tweet,并检索原始的纯文本以及可能有用的其他功能。 大约30%的推文不再可用,因此我们估算了丢失的数据,并使用自然语言处理技术来清理文本特征。 模型拟合: 我们训练了朴素贝叶斯,逻辑回归和决策树模型来预测三个类别: 1:支持人为气候变化的信念 0:既不支持也不反对人为气候变化的信念 -1:驳斥人为气候变化的信念 由于我们在许多0级推