统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
上QQ阅读APP看书,第一时间看更新

10.6 校直数据的重述

幂阶梯法是用于重新表述变量的一种方法,是为了将两个连续变量X和Y之间的突起校直。数据中存在的突起可以细分为四种形态,见图10.3。当X-Y关系出现类似其中一种情况时,幂阶梯法和突起规则都可以采用,这两个途径都可以指导我们在阶梯中选择“梯级”,将突起校直。大多数据都有突起,然而,当数据中出现扭结点或拐点时,我们还需要另一种方法,本章稍后将进一步介绍。

图10.3 突起规则