LASSO方法的总结与思考 统计学习中如果一味提高对训练数据的拟合能力模型复杂度也会相应提高这种情况下训练出的方程总是能很好的拟合训练数据得到的代价函数可能非常接近于0但这样的曲线千方百计的去拟合训练数据通常会导致它无法泛化到新的数据样本中这类情况被叫做过拟合(overfitting)例如在生物医学领域中数据的维度很高但由于收集数据需要实验代价高昂可用的训练数据却相当少很容易发生过拟合问题[3]