PNAS crowdsourcing data 源码
PNAS众包数据 这些数据文件用于支持论文“突发性危险评估的社会媒体数据”。 (李灵瑶,米歇尔·本西,马自慧,王禹和格雷戈里·贝歇尔)。 最近的三起灾害事件被用作该研究的基础:(1)2019年7月的里奇克莱斯特地震序列;(2)2019年4月的巴黎圣母院大火;以及(3)2019年7月的纽约市停电。 1. 2019年7月的里奇克莱斯特地震序列 Twitter搜索API的过滤词为“地震”,用于抓取2019年7月4日至7月10日与地震有关的数据。该词库暗示了损坏(例如,“损坏”,“伤害”,“破坏”和“开发了“ crack。”),并用于过滤与损害相关的推文。 用于损害分析的最终数据集包括51,043条推文,其中9,197条是原始推文。 假定描述损坏的原始推文很可能是第一手观察或报告,则删除了用于分析的转发。 2. 2019年4月的巴黎圣母院大火 已使用带有搜索短语“ Notre Dame”的Twi
文件列表
PNAS-crowdsourcing-data-main.zip
(预估有个20文件)
PNAS-crowdsourcing-data-main
NYC blackout data
test.txt
1B
CA earthquake data
3.false_filter_seeds.xlsx
35KB
6.county_damage.xlsx
9KB
10.embedding_lstm.ipynb
91KB
8.ca_earthquake.twb
172KB
2.damage_filter_seeds.docx
32KB
1.tweet_data.xlsx
700KB
暂无评论