Twitter_争吵 我对Twitter存档进行了增强的第一个数据集进行了评估,发现以下质量问题: •Tweet_id类型为int,应为字符串 •删除非原始的推文(转发) •将时间戳数据类型从字符串更改为日期时间类型 •为狗创建专栏 •修复expanded_urls中缺少的值 对于第二个数据集,我们有一个图像projections.tsv,在对其进行评估之后,我发现了以下问题: •jpg_url列中的URL重复 •Tweet_id数据类型不正确,应为字符串 •请注意p1,p2和p3列中的一些无用的下划线而不是空格 •修复大写字母,并用小写字母替换 对于第三个数据集(即tweets jso