EP GBDT:EP GBDT是仅通过使用序列信息来预测必需蛋白质的一种计算方法 源码
乙交酯 EP-GBDT是仅通过使用序列信息进行必需蛋白质预测的一种计算方法。 要求 numpy == 1.18.1 scikit学习== 0.23.1 imblearn == 0.7.0 用法 在这个GitHub项目中,我们提供了一个演示以演示EP-GBDT的工作方式。 在Raw data文件夹中,我们提供了原始蛋白质序列及其标签。 您可以将它们用于其他基于序列的必需蛋白质预测。 在“加工的特征”文件夹中,我们提供了通过伪氨基酸组成(PseAAC)工具获得的加工的蛋白质序列特征。 在通过8种中心方法得出的预测结果中,我们提供了原始PPI网络和8种中心方法的结果。 data_h.pkl和data_y.pkl用于分别存储由202010086的随机种子生成的训练集和测试集。 随机种子用于确保您可以产生与本文相同的结果。 在我们的演示中,我们提供了一个python文件(train_main
文件列表
EP-GBDT-main.zip
(预估有个15文件)
EP-GBDT-main
train_main.py
5KB
Raw data
human_protein_sequence_remove_redundancy.xlsx
3.73MB
data_h3.pkl
4.97MB
predicted results by 8 centrality methods
EC_score.txt
351KB
DC_score.txt
351KB
SC_score.txt
359KB
MNC_score.txt
151KB
暂无评论