GPT-GNN:图神经网络的生成式预训练 GPT-GNN是通过生成式预训练来初始化GNN的预训练框架。 它可以应用于大规模和异构图形。 有关更多详细信息,请参见我们的KDD 2020论文 。 概述 关键包是GPT_GNN,其中包含高级GPT-GNN预训练框架,基本GNN模型以及基本图结构和数据加载器。 为了说明如何将GPT_GNN框架应用于任意图,我们提供了在异构图(OAG)和齐次图(reddit)上进行预训练的示例。 他们两个都是大规模的。 在每个example_*包,还有一个pretrain_*.py训练前一个GNN给定的图形文件,并且还多finetune_*.py培训文件和验证对下游任务。 数据集 对于开放式学术图(OAG) ,我们提供了一个异构图,其中包含从1900年至2020年的高引用CS论文(8.1G)。 您可以通过下载预处理图。 我们按时间划分数据:预训练(t <20