知识网络 该存储库包含Web会议2021年论文《的源代码和预处理数据集。 数据集 Twitter数据集 收集Twitter数据集[1]来评估社交事件检测方法。 在过滤掉重复且不可恢复的推文之后,数据集包含68,841个与503事件类别相关的手动标记的推文,分布了四个星期。 请在找到原始数据集 MAVEN数据集 MAVEN [2]是根据Wikipedia文档构建的一般域事件检测数据集。 我们删除与多种事件类型关联的句子(即消息)。 过滤后的数据集包含10,242条与154个事件类别相关的消息。 请在找到原始数据集 数据格式和用法 有关数据格式和用法,请参阅此文档。 基准线 对于Word2vec