LightGBM(LightGradientBoostingMachine) 是微软开源的一个实现GBDT算法的框架,支持高效率的并行训练。GBDT(GradientBoostingDecisionTree)是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合等优点。GBDT在工业界应用广泛,通常被用于点击率预测,搜索排序等任务。GBDT也是各种数据挖掘竞赛的致命武器,据统计Kaggle上的比赛有一半以上的冠军方案都是基于GBDT。LightGBM提出的主要原因是为了解决GBDT在海量数据遇到的问题,让GBDT可以更好更快地用于工业实践。其具有以下优点