联合国开发计划署 联合国一般性辩论(UNGD)是每年一度的高级别活动,每个联合国会员国都可以向所有其他会员国讲话。 UNGD语料库(UNGDC)提供了1970年至2018年期间200个国家/地区的英语演讲文本:总共约8,093场演讲。 UNGDC数据集由Slava Jankin Mikhaylov,Alexander Baturo和Niheer Dasandi于2017年创建。有关最新版本,请参见其。 您也可以在此上找到其所有复制材料。 他们在《研究与政治》( Research&Politics)杂志上发表的2017年基于数据集的文章可在找到(付费专区)。 在此存储库中,我提供了一个简单的Jupyter笔记本,演示了如何使用数据集来分析和可视化全球外交趋势。 它使用Pandas和SpaCy软件包对数据集进行一些简单的NLP处理,并具有三个主要应用:跟踪国家/地区之间的主题提及; 随着时