背景在药物研发中为了节约时间和成本通常采用建立化合物活性预测模型的方法来筛选潜在活性化合物.具体做法是针对与疾病相关的某个靶标此处为ERα收集一系列作用于该靶标的化合物及其生物活性数据然后以一系列分子结构描述符作为自变量化合物的生物活性值作为因变量构建化合物的定量结构活性关系Quantitative Structure Activity RelationshipQSAR模型然后使用该模型预测具有更好生物活性的新化合物分子或者指导已有活性化合物的结构优化.目标根据提供的ERα拮抗剂信息1974个化合物样本每个样本都有729个分子描述符变量1个生物活性数据5个ADMET性质数据构建化合物生物活性的定量预测模型和ADMET性质的分类预测模型从而为同时优化ERα拮抗剂的生物活性和ADMET性质提供预测服务.主要思路针对问题1构建mRMR置换特征重要性混合模型.首先使用最大相关最小冗余特征选择方法mRMR筛选出50个候选主要分子描述符然后结合置换特征重要性方法进行重要性排序得到20个主要分子描述符.使用增量特征选择模型