论文研究 基于混合和分集的自适应集成方法进行二进制分类
本文提出了一种自适应的,基于混合的,多样化的集成方法,以提高二进制分类的性能。 所提出的方法是基础模型的非线性组合,以及对每个数据实例的最合适模型的自适应选择的应用。 集成方法是一种重要的机器学习技术,它使用多个单一模型来构建混合模型。 混合模型通常比单个模型表现更好。 在给定的数据集中,使用不同的机器学习算法训练的各种单一模型的应用在识别给定训练样本中的模式方面将具有不同的功能。 重复购买者预测数据集和人口普查收入预测数据集上验证了该方法的有效性。 实验结果表明,与最佳单个模型相比,“重复购买者”数据集的F1得分提高了18.5%。 此改进还表明,提出的集成方法具有处理不平衡数据集的出色能力。
暂无评论