统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
上QQ阅读APP看书,第一时间看更新

10.8.2 平滑预测值与实际值散点图

另一个有价值的能够展现一个结构优缺点的有用的散点图是平滑预测值与实际值散点图,就是根据一个参考变量值的实际回应平均值制作的预测回应平均值散点图。画图步骤和解释如下:

1)对于每个参考变量,对合适的LRM的回应的预测概率进行求均值计算,算出预测回应的平均值。类似地,通过对参考变量的每个值的实际回应求取平均值,计算实际回应的平均值。

2)点对(预测回应的平均值,实际回应的平均值)称作平滑点。

3)画出这些平滑点的散点图,并用参考变量的值标识它们。如果这个结构有10个以上的值,则采用十分位的平滑点值。

4)在散点图上加一条45°直线,作为参照,从图像上评估一个预测回应结构的重要性程度,以确认这个结构是否正确。如果这条直线上的平滑点的预测回应平均值和实际回应平均值是相等的,则这个结构很可能就是正确的。那些点距离这条45°线越近,这个结构的确定性越高。相反,这些点相对这条线越发散,这个结构的确定性越低。