数据挖掘分类程序(KDD CUP2001)
包括一篇数据挖掘分类技术的实验研究报告,以及相关程序,分类的题目是KDDCUP2001年的题目,任务是对已给
定的描述生物分子三维结构的139351个属性中,分类预测出该分子化合物对目标体的化学活性,从而达到帮助药物设计的目的。实验现有的数据包括:110个已标记活性标签的描述分子三维结构的139351维数据,634个为标记活性标签的三维结构数据。希望根据这些提供的数据,采用适当的分类方法,提供出一个经过训练的分类器,能够尽可能准确的帮助未标记活性的分子化合物确定其活性,实验数据可到KDD的官网上下载
文件列表
.rar
(预估有个11文件)
code
源代码
TriTrain.java
9KB
MyErrorMeasure.java
2KB
ErrorMeasurement.java
2KB
MyClassifier.java
5KB
数据预处理
trainchoose.txt
43KB
GetDataForMatlab.java
3KB
fea_sort.txt
2KB
用户评论