aoc_reply_dataset:构建Twitter答复的数据集以进行无监督的学习机器人阻止 源码
AOC回复数据集 又称:请勿阅读评论 问题 众议员亚历山大·奥卡西奥·科尔特斯(Alexandria Ocasio-Cortez)在Twitter上的“ @AOC”回复是政治讨论的热点。 经常向有毒的用户指责他们是“机器人”。 我曾尝试在此阻止最差的帐户,但在这里和其他受欢迎的帐户(新闻文章,Fox新闻中精选的其他代表)中都出现了更多的帐户。 我无法确定这些帐户是否代表真实用户,要诱骗的刻录机帐户,直到他们被阻止或有组织的反对。 数据集 我在replies_by_tweet中包含了一个示例JSON答复,在all_tweets /中包含了完整的数据集-每个原始AOC Tweet或Retweet
文件列表
aoc_reply_dataset:构建Twitter答复的数据集以进行无监督的学习机器人阻止
(预估有个381文件)
scan.js
4KB
replies-hour.js
2KB
replies-histogram.js
2KB
zero-hour.html
317B
month-timeline.html
310B
hierclusters.json
278KB
.gitignore
64B
1103998951227838469.json
135KB
1108908752865054720.json
133KB
00_ids.csv
2.08MB
暂无评论