一、误差分析
1.真值与平均值
实验过程中要做各种测试工作,由于仪器、测试方法、环境、人的观察力、实验方法等都不可能做到完美无缺,因此无法测得真值(真实值)。如果对同一考察项目进行无限多次的测试,然后根据误差分布定律中正、负误差出现的概率相等的概念,可以求得各测试值的平均值,在无系统误差(系统误差的含义请参阅“误差与误差的分类”)的情况下,此值为接近真值的数值。一般来说,测试的次数总是有限的,用有限测试次数求得的平均值,只能是真值的近似值。
常用的平均值有下列几种:①算术平均值;②均方根平均值;③加权平均值;④中位值(或中位数);⑤几何平均值。计算平均值方法的选择,主要取决于一组观测值的分布类型。
(1)算术平均值
算术平均值是最常用的一种平均值,当观测值呈正态分布时,算术平均值最接近真值。设x1,x2,…,xn为各次观测值,n代表观测次数,则算术平均值定义为
(4-1)
(2)均方根平均值
均方根平均值应用较少,其定义为
(4-2)
式中各符号意义同前。
(3)加权平均值
若对同一事物用不同方法测定,或者由不同的人测定,计算平均值时,常用加权平均值。计算公式为
(4-3)
式中,wi为与各观测值相应的权,其余符号意义同前。
各观测值的权wi,可以是观测值的重复次数,也可以是观测者在总数中所占的比例,或者可根据经验确定。
(4)中位值
中位值是指一组观测值按大小次序排列的中间值。若观测次数是偶数,则中位值为正中间两个值的平均值。中位值的最大优点是求法简单。只有当观测值的分布呈正态分布时,中位值才能代表一组观测值的中心趋向,近似于真值。
(5)几何平均值
如果一组观测值是非正态分布,对这组数据取对数后,所得图形的分布曲线更对称时,常用几何平均值。几何平均值是一组n个观测值连乘并开n次方求得的值,计算公式如下
(4-4)
也可用对数表示
(4-5)
2.误差与误差的分类
大气污染控制工程实验过程中,各项指标的监测常需通过各种测试方法来完成。由于被测量的数值形式通常不能以有限位数表示,且因认识能力不足和科技水平的限制,测量值与其真值并不完全一致,这种差异表现在数值上称为误差。任何监测结果均具有误差,误差存在于一切实验中。
(1)绝对误差与相对误差
观测值的准确度一般用误差来量度。个别观测值xi与真实值μ之差称为个别观测值的误差,即绝对误差Ei,用公式表示为
Ei=xi-μ (4-6)
绝对误差Ei的数值越大,说明观测值xi偏离真实值μ越远。若观测值大于真实值,说明存在正误差;反之,存在负误差。
实际上,对于一组观测值的准确度,通常用各个观测值xi的平均值来表示。因此,绝对误差又可表示为
(4-7)
在实际应用中由于真实值不易测得,所以常用观测值与平均值之差表示绝对误差,严格地说,观测值与平均值之差应称为偏差,但在工程实践中多称为误差。
显然,只有绝对误差的概念是不够的,因为它没有同真实值联系起来。相对误差是绝对误差与真实值的比值,即
Er=Ei/μ (4-8)
实际应用中由于真实值μ不易测得,常用观测值的平均值代替真实值μ。
相对误差用于不同观测结果的可靠性对比,常用百分数表示。
(2)系统误差与随机误差
根据误差的性质及发生的原因,误差可分为系统误差、随机误差和过失误差三种。
1)系统误差 系统误差也称为可测误差,是指在测定中未发现或未确认的因素所引起的误差。其特征是:单向性,即误差的符号与大小恒定,或按照一定的规律变化;系统性,即在相同的条件下进行同样的测定时会重复出现。在一般情况下,如果能找到产生的原因,可对其进行校正或设法加以消除。产生系统误差的原因有以下几个方面。
①方法误差 这是由于分析方法不当造成的,是比较严重的误差,一般都能找到物理或化学的原因。
②仪器或试剂误差 这是由于装置不良或试剂不纯引起的误差。
③操作误差 主要是指操作者不遵守操作规程而造成的误差,有时也称为手法误差。
④环境改变引起的误差 主要是指外界的温度、压力和湿度等的变化引起的误差。
2)随机误差 随机误差也称为偶然误差,它是由难以控制的因素引起的,通常并不能确切地知道这些因素,也无法说明误差何时发生或者不发生,它的出现纯粹是偶然的、独立的和随机的。但是随机误差服从统计规律,可以通过增加实验的测定次数来减小,并用统计的方法对测定结果作出正确的表述。实验数据的精确度主要取决于随机误差,随机误差是由研究方案和研究条件总体所固有的一切因素引起的。
3)过失误差 过失误差又称错误,是由于操作人员粗枝大叶、过度疲劳或操作不正确等因素引起的,是一种与事实明显不符的误差。只要操作者加强责任心提高操作水平,过失误差是可以避免的。
3.准确度与精密度
(1)准确度与精密度的关系
准确度是指测定值与真实值的偏差的程度,它反映了系统误差和随机误差的大小,一般用相对误差表示。
精密度是指在控制条件下用一个均匀试样反复测量,所得数值之间的重复程度。它反映了随机误差的大小,与系统误差无关。因此,评定观测数据的好坏,首先要考察精密度,然后再考察准确度。
一般来说,实验结果的精密度很高,并不等于准确度也很高,这是因为即使有系统误差的存在,也不妨碍结果的精密度。两者的关系可以由图4-1所示的打靶图来说明。
图4-1 以打靶为例说明准确度和精密度的关系
(2)提高准确度和精密度的方法
为了提高实验方法的准确度和精密度,必须减少和消除系统误差和随机误差,主要应做到:①减少系统误差;②增加测定的次数;③选择合适的实验方法。
(3)精密度的表示方法
若在某一条件下进行多次测试,其误差为σ1,σ2,…,σn。因为单个误差可大可小、可正可负,无法表示该条件下的测定精密度,因此常采用极差、算术平均误差、标准误差等表示精密度的高低。
1)极差 极差也称为范围误差,是指一组观测值中的最大值与最小值之差,是用来描述实验数据分散程度的一种特征参数,其计算公式为
R=xmax-xmin (4-9)
极差的缺点是只与两极值有关,而与观测次数无关。用极差反映精密度的高低比较粗糙,但计算方便。在快速检验中可以度量数据波动的大小。
2)算术平均误差 算术平均误差是观测值与平均值之差的绝对值的算术平均值。其表达式为
(4-10)
算术平均误差的缺点是无法表示出各次测试间彼此符合的情况。彼此接近的情况下,与另一组测试中偏差有大、中、小三种的情况下可能完全相等。
3)标准误差 标准误差也称为均方根误差或均方误差,是指各观测值与平均值之差的平方和的算术平均值的平方根。其计算式为
(4-11)
在有限的观测次数中,标准误差常表示为
(4-12)
由式(4-11)可以看到,当观测值越接近于平均值时,标准误差越小;当观测值与平均值偏差越大时,标准误差也越大。即标准误差对测试中的较大误差或较小误差比较灵敏,所以它是表示精密度的较好方法,是表明实验数据分散程度的一个特征参数。
【例】已知两组测试的偏差分别为+4、+3、-2、+2、+4和+1、+5、0、-3、-6,试计算其误差。
解 由式(4-10)计算算术平均误差。
由式(4-11)计算标准误差。
上述计算结果表明,虽然第一组测试所得的偏差彼此比较接近,第二组测试所得的偏差较离散,但用算术平均误差表示时,两者所得结果相同;而标准误差则能较好地反映出测试结果与真实值的离散程度,从这个意义上讲,采用标准误差更有效些。
4.误差分析
(1)单次测量值误差分析
大气污染控制工程实验的影响因素多且测试量大,有时由于条件限制或准确度要求不高,特别是在动态实验中不允许对被测值做重复测量,故实验中往往对某些指标只能进行一次测量。这些测量值的误差应根据具体情况进行具体分析。例如,对偶然误差较小的测量值,可按仪器上注明的误差范围进行分析计算;无注明时,可按仪器最小刻度的1/2作为单次测量的误差。如某溶解氧测定仪,仪器精度为0.5级。当测得DO的浓度为3.2mg/L时,其误差值为3.2×0.005mg/L=0.016mg/L;若仪器未给出精度,由于仪器最小刻度为0.2mg/L,每次测量的误差可按0.1mg/L考虑。
(2)重复多次测量值误差分析
在条件允许的情况下,进行多次测量可以得到比较准确可靠的测量值,并用测量结果的算术平均值近似替代真值。误差的大小可用算术平均误差和标准误差来表示。工程中多用标准偏差来表示。
(3)间接测量值误差分析
实验过程中,经常需要对实测值经过公式计算后获得另外一些测得值用于表达实验结果或用于进一步分析,称为间接测量值。由于实测值均存在误差,间接测量值也存在误差,称为误差的传递。表达各实测值误差与间接测量值间关系的公式称为误差传递公式。
1)间接测量值算术平均误差计算 采用算术平均误差时,需考虑各项误差同时出现最不利的情况,将算术平均误差或算术平均相对误差的绝对值相加。
①加、减法运算中间接测量值误差分析 设N=A+B或N=A-B,则有
δN=δA+δB (4-13)
式中,δN为间接测量值N的算术平均误差;δA、δB分别为直接测量值A、B的算术平均误差。即和、差运算的绝对误差等于各直接测得值的绝对误差之和。
②乘、除法运算中间接测量值误差分析 设N=AB或,则有
(4-14)
即乘、除运算的相对误差等于各直接测得值的相对误差之和。
2)间接测量值标准误差计算 若N=f(x1,x2,…,xn),采用标准误差时,间接测量值N的标准误差传递公式为
(4-15)
式中,σN为间接测量值N的标准误差;,,…,分别为直接测量值x1,x2,…,xn的标准误差;分别为函数f(x1,x2,…,xn)对变量x1,x2,…,xn的偏导数,并以代入求其值。