可解释机器学习:黑盒模型可解释性理解指南
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.1.4 解释单个实例预测

单个实例的各个特征对预测有多大贡献?这可以通过计算这个实例的特征效应得到。对于特定实例的特征效应的解释,只有当与各个特征的特征效应分布相比较时才有意义。例如解释来自自行车数据集的第6 个实例的线性模型的预测,如表4-3 所示,该实例具有以下特征值。

为了获得这个实例的特征效应,必须将它的特征值乘以线性回归模型中相应的权重。对于值为“是”的“是否工作日”的特征,特征效应为124.9;对于1.604°C 的温度特征,特征效应是177.6。将这些单独的特征效应作为“叉号”添加到效应图中。效应图展示了数据中的效应分布,这使得能够将单个实例的特征效应与数据中的效应分布进行比较。如图4-3 所示,图中显示效应分布,并突出感兴趣实例的特征效应。

如果对训练数据实例的预测求平均,得到的平均值是4504。相比之下,第6 个实例的预测值很小,因为预测只有1571 辆自行车被租赁。效应图揭示了原因。箱线图显示数据集所有实例的效应分布,“叉号”显示第6 个实例的效应。第6 个实例的“温度”特征的特征效应较小,因为这一天的温度为1.604°C,与其他大多数日期的温度相比较低(这里“温度”特征的权重为正)。此外,与其他数据实例相比,“天数”特征的特征效应也较小,因为该实例自第一天起仅过了5 天,而且这个特征也是正的权重。

图4-3 单个实例的效应图