EP GBDT:EP GBDT是仅通过使用序列信息来预测必需蛋白质的一种计算方法源码

shy88153 2 0 ZIP 2021-03-26 04:03:53

乙交酯 EP-GBDT是仅通过使用序列信息进行必需蛋白质预测的一种计算方法。要求 numpy == 1.18.1 scikit学习== 0.23.1 imblearn == 0.7.0 用法在这个GitHub项目中,我们提供了一个演示以演示EP-GBDT的工作方式。在Raw data文件夹中,我们提供了原始蛋白质序列及其标签。您可以将它们用于其他基于序列的必需蛋白质预测。在“加工的特征”文件夹中,我们提供了通过伪氨基酸组成(PseAAC)工具获得的加工的蛋白质序列特征。在通过8种中心方法得出的预测结果中,我们提供了原始PPI网络和8种中心方法的结果。 data_h.pkl和data_y.pkl用于分别存储由202010086的随机种子生成的训练集和测试集。随机种子用于确保您可以产生与本文相同的结果。在我们的演示中,我们提供了一个python文件(train_main

文件列表

EP-GBDT-main.zip (预估有个15文件)

EP-GBDT-main

train_main.py 5KB

Raw data

human_protein_sequence_remove_redundancy.xlsx 3.73MB

data_h3.pkl 4.97MB

predicted results by 8 centrality methods

EC_score.txt 351KB

DC_score.txt 351KB

SC_score.txt 359KB

MNC_score.txt 151KB

CC_score.txt 324KB

LAC_score.txt 257KB

BC_score.txt 346KB

NC_score.txt 270KB

LICENSE 1KB

Processed features

processed protein sequence features.xlsx 4.9MB

README.md 1KB

saved_model

GBDT816_h3.pkl 20.4MB

用户评论

暂无评论

应用GPU集群加速计算蛋白质分子场

应用GPU集群加速计算蛋白质分子场

33 2019-07-13
蛋白质质谱解析插件

蛋白质组学中搜库结果解析与可视化插件，支持pride.xml和mzidentML格式解析和可视化

49 2019-07-14
组氨酸标签蛋白质纯化

组氨酸标签蛋白纯化--适用于初学者

8 2020-12-31
蛋白质结晶研究进展

蛋白质结晶是研究生物大分子结构的重要手段,也是制约其发展的瓶颈。总结了蛋白质结晶的常用方法及其影响因素,并介绍了近年来蛋白质结晶发展的新技术和新手段。

22 2020-07-22
论文研究蛋白质序列中的多重分形分析.pdf

采用多重分形谱对蛋白质序列进行分析。按照SCOP分类法，从PDB中选取三条同属于类的分维相近的蛋白质序列，利用多重分形分别对蛋白质空间距离以及序列中氨基酸的极性、体积的复杂性进行比较。实验结果表明，多

28 2020-05-18
一种时间序列数据预测方法的应用

对小样本数据预测有一定的适应性。不错，作者思想挺好的！

29 2019-01-22
R语言编写的GBDT算法

R语言GBDT算法

86 2019-04-29
BioPPIExtractor用于生物医学文献的蛋白质蛋白质相互作用提取系统

从生物医学文献中自动提取蛋白质-蛋白质相互作用信息可以帮助建立蛋白质关系网络,预测蛋白质功能并设计新药。本文介绍了用于生物医学文献的蛋白质-蛋白质相互作用提取系统BioPPIExtractor。该

10 2021-02-23
PconsC3更快更准确和完全开源的蛋白质接触预测方法源码

PconsC3 更快,更准确和完全开源的蛋白质接触预测方法如果使用PconsC3,请引用: Carlo Baldassi,Marco Zamparo,Christoph Feinauer,Andre

13 2021-05-22
论文研究蛋白质亚细胞定位预测研究综述.pdf

蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。随着后基因组时代中蛋白质序列数据的指数增长，研究基于机器学习的计算性蛋白质亚细胞定位预

48 2019-08-17

EP GBDT:EP GBDT是仅通过使用序列信息来预测必需蛋白质的一种计算方法 源码

文件列表

用户评论

推荐下载

EP GBDT:EP GBDT是仅通过使用序列信息来预测必需蛋白质的一种计算方法源码