分析测试统计方法和质量控制
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第4章 回归分析

4.1 概述

回归分析是研究变量之间相互依赖关系的一种统计方法,是数理统计学中应用广泛的一个分支。

两个变量之间的关系一般可分为两类:一类是变量之间存在着完全确定的函数关系,一个变量或一些变量可以确定另一变量的值。例如,圆的周长l和面积S与其半径r存在确定的函数关系l=2πrSr2。电学中电压V、电流I和负载电阻R间有明确的函数关系V=IR。另一类是变量间存在密切的关系,但没有达到严格的确定关系,而具有某种程度的不确定性,这种变量之间不完全确定的关系称为相关关系。相关关系是一种统计关系,因变量y的取值与自变量x的取值虽有一定关系,但y的取值带有一定的随机性,它只是随自变量x大体上按一定的规律而变化。例如,儿童是身高和体重与年龄有一定的关系,虽然这种关系也可以用一个函数式表示,但具体到一个儿童,其计算值可能与实际测量值存在一定差距。又如,粮食产量与施肥量有关,肥料有助于提高粮食产量,但施肥量相同的田地其粮食产量仍有差别。

函数关系与相关关系的差别在于:函数关系是由自变量x决定因变量y的值,而相关关系是由x值决定y值的概率分布。

确定性关系和相关关系是两种不同类型的变量关系,但它们之间没有绝然的区别。由于测量误差和其他因素的影响,确定性关系往往以相关关系表现出来,而当人们对事物变化规律有深刻认识时,原来是相关关系的变量又能找出其确定性关系的表达式。

在分析测试中,测量结果与其他影响因素之间虽有密切的关系,但又不像数学函数关系,因变量y随自变量x严格地按确定的规律变化,而通常表现为相关关系。当自变量x变化时,因变量y大体上按某种规律变化(即在一定范围内变化,有时会有例外),不能由xi精确求出yi值。如ICP-AES、AAS等分析方法,测量的光谱强度I(或吸光度A)与其浓度c间通常有I=a+bc关系式,但由于测量误差、干扰的存在,仪器性能、测量条件的影响,关系式中的系数ab会在一定范围内变动。一定浓度c在重复测量时,测得的I会在一定范围内变化,或者说由强度I计算出的浓度c不是十分确定的。用回归直线表示Ic之间的关系时,试验点不一定都在按其相关关系式画出的直线上,试验点与回归直线有一定的离散度。

回归分析是研究相关关系的一种数学工具,它是利用数理统计方法,在大量的试验数据和观察中,寻找隐藏在随机性后面的统计规律。

回归分析的内容有:

①从一组数据出发,计算变量间相关关系的数学表达式;

②对这些相关关系表达式进行可信度的检验和判断;

③从影响某一变量的许多自变量中判断影响量的主要因素和次要因素;

④利用求得的相关关系,对试验和生产过程进行预测和控制。

在分析测试中,遇到最多的是一元线性回归问题。一元线性回归虽简单,但应用广泛,且包含了回归分析的基本思想和方法,具有普遍意义。