构建企业级推荐系统:算法、工程实现与案例分析
上QQ阅读APP看书,第一时间看更新

2.4.2 GBDT模型

梯度提升决策树(Gradient Boosting Decision Tree,GBDT)是一种基于迭代思路构造的决策树算法(见本章参考文献[15]),该算法在实际应用中将生成多棵决策树,并将所有树的结果进行汇总以得到最终预测结果。它将决策树与集成思想进行了有效的结合,通过将弱学习器提升为强学习器的集成方法来提高预测精度。GBDT是一类泛化能力较强的学习算法。

2014年Facebook发表了一篇将GBDT+LR模型用于其广告CTR预估的论文(见本章参考文献[16]),开启了将GBDT模型应用于搜索、推荐、广告业务的先河。作为一种常用的树模型,GBDT可天然地对原始特征进行特征划分、特征组合和特征选择,并得到高阶特征属性和非线性映射,从而可将GBDT模型抽象为一个特征处理器,通过GBDT分析原始特征以获取更利于逻辑回归分析的新特征,这也正是GBDT+LR模型的核心思想—利用GBDT构造的新特征来训练逻辑回归模型。