4.4 二元线性回归分析
在实际工作中,影响因变量(y)的自变量(x)往往不止一个,可能有多种因素,这就需要用多元回归分析方法。多元回归分析的基本原理与一元回归方法相同,由于自变量多,计算较为复杂。二元线性回归分析是多元线性回归中最简单的情况。
4.4.1 二元线性回归方程求解
设两个自变量分别为x1和x2,因变量为y,二元线性回归方程可表示为:
(4-61)
式中,a为常数项,b1、b2分别为x1、x2的偏回归系数,反映x1、x2对因变量y的影响程度。通过一系列自变量(x11,x21)、(x12,x22)、…、(x1n,x2n),分别测量得因变量y1、y2、…、yn,用最小二乘法确定常数项a和偏回归系数b1、b2。
与一元线性回归方程类似,二元线性回归方程的变差平方和可表示为:
(4-62)
满足变差平方和的条件是:
(4-63)
(4-64)
(4-65)
解式(4-63)得:
(4-66)
将式(4-66)代入式(4-64)、式(4-65),得:
(4-67)
(4-68)
令
解式(4-67)和式(4-68),整理得:
(4-69)
(4-70)
回归方程中的a用式(4-66)计算。
4.4.2 二元线性回归方程的显著性检验
4.4.2.1 方差分析
在求得二元线性回归方程后,需要确认y与x1、x2之间是否存在显著的相关性,为此可进行方差分析。
与一元线性回归方程类似,可将y的总变差平方和QT分解成回归变差平方和QR和剩余变差平方和Qe,这样:
式中,
计算方差分析统计量:
(4-71)
对给定显著性水平α,当,则认为在显著性水平下,y与x1、x2存在显著的线性关系。反之,不存在显著的线性关系。
表4-18给出了多元线性回归方程方差分析表。
表4-18 多元线性回归方差分析表
注:m是自变量数,对二元线性回归方程m=2。
4.4.2.2 相关系数
与一元线性回归方程相似,在二元线性回归方程中要检验因变量y与自变量x1、x2的相关性,可用一个全相关系数R来表征它们之间的相关性。
(4-72)
对二元线性方程,亦可表示为:
(4-73)
当R≥r0.05,(n-3)时,认为所建立的回归方程在95%置信水平是有意义的。对二元回归方程,还可检验y对x1或x2是否有显著意义。类似一元回归方程的相关系数计算[式(4-14)],用和分别表示y对x1和y对x2的偏相关系数,用表示y对x1与x2的偏相关系数,有:
(4-74)
并有:
(4-75)
4.4.3 二元线性回归方程的精度
类似于一元线性回归方程,对于二元线性回归方程,用残余标准差表示回归方程的精度:
(4-76)
式中,Qe是残差平方和;ν是自由度;n是回归方程试验点数目;m是回归方程自变量数目。对二元回归方程:m=2,ν=n-3。
【例4-9】 已知某矿区铁精矿的全铁含量与其二氧化硅和三氧化铝含量有关,通常,二氧化硅和三氧化铝含量高,则全铁含量低。根据12个样本的测量结果(表4-19),试计算它们的回归方程、相关系数和标准差。
表4-19 铁含量与其二氧化硅和三氧化铝含量的关系
解 本题按二元一次方程求解,将表4-19各数据填入Excel表格,计算以下参数:
按式(4-69)、式(4-70)和式(4-66)
由此,回归方程表示为:y=69.91-0.981x1-1.222x2
按式(4-72),求全相关系数R:
按式(4-76),计算回归方程标准差se:
二元一次方程的计算较为复杂,而且容易出错。在实践中可利用Excel的数据分析/回归功能进行计算,在y值输入区域输入Fe含量,在x值输入区域输入SiO2和Al2O3含量,即可计算并给出回归方程的a、b1、b2、R和se等参数(见第13章图13-23)。
4.4.4 二元非线性化回归
对二元非线性回归,可用一元非线性回归方程的方法处理,先将自变量设置为线性项,然后按二元线性回归方法处理,求出常数项a和回归系数b1、b2,建立回归方程。在此基础上进行方程的显著性检验,计算回归方程的残余标准差和相应的置信区间。