乙交酯 EP-GBDT是仅通过使用序列信息进行必需蛋白质预测的一种计算方法。 要求 numpy == 1.18.1 scikit学习== 0.23.1 imblearn == 0.7.0 用法 在这个GitHub项目中,我们提供了一个演示以演示EP-GBDT的工作方式。 在Raw data文件夹中,我们提供了原始蛋白质序列及其标签。 您可以将它们用于其他基于序列的必需蛋白质预测。 在“加工的特征”文件夹中,我们提供了通过伪氨基酸组成(PseAAC)工具获得的加工的蛋白质序列特征。 在通过8种中心方法得出的预测结果中,我们提供了原始PPI网络和8种中心方法的结果。 data_h.pkl和data_y.pkl用于分别存储由202010086的随机种子生成的训练集和测试集。 随机种子用于确保您可以产生与本文相同的结果。 在我们的演示中,我们提供了一个python文件(train_main