第三章 数据处理与统计分析
第一节 测量误差
测量误差问题是计量测试中的一个基本问题,长期以来,受到人们广泛的重视。由于各种因素的影响,任何一种测量都不可避免地存在误差,人们已比较习惯应用系统误差和随机误差概念。近年来比较普遍地认为,表示测量结果的分散性,用“不确定度”更为合适。但是“误差”对于表示和分析测量仪器和设备的准确性,估计测量结果偏离约定真值的程度,研究改善测量准确度的方法等,都是必不可少的。
根据实际计量测试的需要,计量人员了解和掌握测量误差的一些基本概念,以及掌握评估测量误差的性质与大小的基本方法是十分必要的。
一、测量误差的基本概念
测量误差是指由测量赋予的被测量之值与被测量的真值之差。但是被测量的真值是无法准确得到的,虽然科技在不断发展,测量手段和测量方法不断改进,所确定的真值也只能是更接近客观存在的真值。因此通常所说的真值,实际上是约定真值。
在实际计量中,上一级的测量标准所复现的量值对下一级的测量标准,或测量标准所复现的量值对被测量来说,视为约定真值,也称为指定值或参考值(曾称为标准值);在多次重复测量中,有时也用多次测量的算术平均值作为约定真值。
(一)绝对误差
测量误差有时称为测量的绝对误差。当用Δx表示绝对误差时,Δx是测量结果x与被测量的真值x0之差,即
当Δx为正时,称为正误差;当Δx为负时,称为负误差。由于x0不能确定,所以测量误差Δx是个理想的值,实际上常用指定值或多次测量的算术平均值(即约定真值)作为x0的估计值,得到的是Δx的估计值。从定义上可知,得到的Δx估计值,通常是有量纲和正或负符号的量值。
(二)相对误差
相对误差是绝对误差(即测量误差)除以被测量的真值,即
相对误差通常以百分数表示,应是量纲一的量或是无量纲但有正或负符号的数值。
由于被测量的真值x0不能确定,通常用约定真值,所以相对误差δx也是理想的值,实际得到的是其估计值。
当真值的指定值为被测量的标称值时,此时得到的相对误差可称为标称相对误差。
(三)分贝误差
分贝误差实际上是相对误差的另一种表示形式。
分贝的定义(对于电压和电流等)是
设x=U2/U1,U1、U2为电压。若x有误差Δx,则D也有一相应的误差ΔD,即
D+ΔD=20lg(x+Δx)
于是分贝误差为
由式(3-5)可得
或
表3-1所列出的是常见分贝(dB)值与U2/U1的换算值。
表3-1 分贝值与U2/U1的换算
上述分贝误差是对电压而言;若对功率P讲,则
另外,在实际工作中,有时用分贝来表示信号电平。为此,必须确定一个基础电平,即所谓的零电平。在电信号中,零电平一般取为1mW的耗散功率(P)在600Ω的纯电阻(R)上所产生的电压降,即
于是,用分贝来表示信号电平的公式为
表3-2所列的便是根据式(3-8)计算的电压—分贝值。
表3-2 电压—分贝值
另外,也可取1μV为零电平(如测量接收机)。此时,应予以注明。
(四)引用误差
引用误差是测量仪器示值的绝对误差与仪器的特定值之比,即
特定值一般称为引用值,通常是指测量仪器的满刻度值或标称范围的上限。
引用误差也是一种相对误差,一般用于连续刻度的多档仪表,特别是电工仪表,引用误差常用来作为这些仪表的准确度等级标志。
如某电表的引用误差小于或等于1.5%,该电表准确度等级为1.5级。
二、系统误差
(一)系统误差的概念
在对同一量进行多次测量的过程中,对每个测得值的误差保持恒定或以可预知方式变化的测量误差称为系统误差。
许多系统误差可通过实验确定(或根据实验方法、手段的特性估算出来)并加以修正。但有时由于对某些系统误差的认识不足或没有相应的手段予以充分确定,而不能修正,此时通常可估计未消除系统误差的界限。
系统误差与测量次数无关,也不能用增加测量次数的方法使其消除或减小。
系统误差按其呈现特征可分为常值系统误差和变值系统误差;而变值系统误差又可分为累积的、周期的和按复杂规律变化的系统误差。
常值系统误差是指在测量过程中绝对值和正负号始终不变的误差。
累积系统误差是指在测量过程中按一定速率逐步增大或减小的误差。例如,由于蓄电池或电池组(在正常工作区间)的电压缓慢而均匀地变化所产生的误差。
周期性系统误差是指在测量过程中周期性变化的误差。如,由度盘偏心所引起的误差。
按复杂规律变化的系统误差则是指在测量过程中按复杂规律变化的误差,一般可用曲线或公式来表示。例如,电能表的误差。
系统误差按其本质被定义为在重复条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。实际上由于真值不能确定和有限次测量的缘故,系统误差并不能完全获知,得到的也是估计值。对测量仪器而言,是测量仪器的“偏移”,通常用适当次数重复测量的示值误差的平均值来估计。
(二)系统误差的产生
系统误差通常来源于影响量,常见的有如下几个来源。
(1)装置误差 测量装置本身的结构、工艺、调整以及磨损、老化或故障等所引起的误差。
(2)环境误差 环境的各种条件,如温度、湿度、气压、电场、磁场等引起的误差。
(3)方法(或理论)误差 测量方法(或理论)不十分完备,特别是忽略和简化等所引起的误差。
(4)人员误差 由于测量者的技术水平、个性、生理特点或习惯等所造成的误差。当然,若是自动测试,则不存在该项误差。
(三)系统误差的抵偿
系统误差不能完全被认知,因而也不能完全被消除,但可以采用下列一些基本方法进行抵偿或减小。
1)测量前设法消除可能消除的误差源。
2)测量过程中采用适当的实验方法,如替代法、补偿法、对称法等,将系统误差消除。
① 替代法:用与被测量对象处于相同条件下的已知量来替代被测量,即先将被测量接入测试回路,使系统处于某个工作状态,然后以已知量替代之,并使系统的工作状态保持不变。例如,利用电桥测量电阻、电感和电容等。
② 补偿法:通过两次不同的测量,使测量值的误差具有相反的符号,然后取平均值。例如,用正反向二次测量来消除热电转换器的直流正反向差。
③ 对称法:当被测量为某量(如时间)的线性函数时,距相等的间隔依次进行数次测量(至少三次),则其中任何一对的对称观测值累积误差的平均值皆等于与两次观测的间隔中点相对应的累积误差(图3-1),即
利用对称性便可将线性累积系统误差消除。
例如,利用对称法来消除由于电池组的电压下降而在直流电位差计中引起的累积系统误差。事实表明,在一定的时间内,电池组的电压下降所产生的误差是与时间成正比的线性系统误差。图3-2是电位差计的原理电路。首先在Rn上平衡标准电压En。
由于电池组的电压下降使工作电流减小,结果有(En/Rn)=I+。
然后在Rx上平衡被测量电压Ex,有(Ex/Rx)= I+。
最后,再次平衡En,有(En/Rn)= I+。
如果每次测量的时间相等,则。
于是通过简单的运算便可得出不含有累积系统误差的Ex值。
图3-1 用对称法消除累积误差示意图
图3-2 电位差计的原理电路
3)通过适当的计算对测量结果引入可能的修正量。
4)通过若干人的重复测量取平均来消除人员操作差异引入的误差。
需要指出,在具体测量中,往往很难将系统误差完全消除。因此应力求比较确切地给出残余系统误差的范围,即未消除的系统误差限。
三、随机误差
(一)随机误差的概念
在同一量的多次测量过程中,每个测得值的误差以不可预知方式变化,就整体而言却服从一定统计规律的测量误差称为随机误差。
随机误差是由尚未被认识和控制的规律或因素所导致的影响量的变化,引起被测量重复观测值的变化,故而不能修正,也不能消除,只能根据其本身存在的某种统计规律用增加测量次数的方法加以限制和减小。图3-3是测量平均值的标准差与测量次数n之间的关系曲线。可见,随n的增加而减小,并且开始较快,逐渐变慢,当n等于5时已较慢,当n大于10时则更慢,故在一般测量中,取n=10或12已足够了。
图3-3 与n的关系曲线
(二)随机误差研究的理论基础
概率论是研究随机现象的数量规律的科学。它是建立在随机事件的一系列基本概念和定义的基础之上的。
为了研究自然界的各种现象,需要进行大量的观察、实验和测量。观察是所有科学研究的基础,在观察时,被观察的对象所呈现的特征可以是质的,也可以是量的,而量值的确定只能通过测量。测量是为确定量值而进行的一组操作。实现每一个规定的观察、实验和测量统称为试验,每一个试验的结果构成一个事件。进行试验的各种条件之总和称为条件组。在一定的条件组下进行同一个试验,可能出现也可能不出现的事件叫随机事件。
实践表明,在相同条件下进行大量的试验,可以得到相当稳定的规律性。这就是将概率论和数理统计方法应用于处理大量观测结果的基础。
(三)随机误差的基本性质
事实表明,大量的观测结果皆服从正态分布。服从正态分布的随机误差具有下列基本统计规律性。
1)正态分布的一系列观测结果,给定概率P的随机误差的绝对值不超出一定的范围,即所谓的有界性。
2)当测量次数足够多时,绝对值相等的正误差与负误差出现的概率相同,测得值是以它们的算术平均值为中心对称分布,即所谓的对称性。
3)当观测次数无限增加时,所有误差的代数和,误差的算术平均值的极限趋于零,即所谓的抵偿性。
4)一系列测得值以它们的算术平均值为中心而相对集中地分布,绝对值小的误差比绝对值大的误差出现的机会多,即所谓的单峰性。
应该说明,上述性质是对常见正态分布类测量进行大量实验的统计结果。其中的有界性、对称性和单峰性不一定对所有的误差都存在,而抵偿性是随机误差的最本质特征。
(四)随机误差的表示方式
随机误差定义为:测量结果与在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值之差。由这个定义知,随机误差等于测量误差减去系统误差。测量误差等于系统误差和随机误差之代数和。由于测量只能进行有限次数,故可能确定的只是随机误差的估计值。
与随机误差的概念有关的表示方式还有以下几种,都曾在不同场合采用过。
1.方均根误差
方均根误差是测量值与真值偏差的平方和除以测量次数n再取平方根。通常由于测量只能进行有限次数,因此有限次测量时方均根误差σ的表达式应为
式中 υi——第i次测量值与算术平均值的偏差,称残余误差或残差;
n——测量次数。
式中 ——n次测量值的算术平均值,。
xi——第i次测量值。
σ所表征的是一个被测量的n次测量列所得结果的分散性,故称为测量列中单次测量的标准差。
如果在相同条件下对同一量值做多组重复的系列测量,每一系列测量都有一个算术平均值,由于随机误差的存在,各个测量列的算术平均值也不相同,它们围绕着被测量的总体均值有一定的分散性,此分散性说明了算术平均值的不可靠性。算术平均值的标准差则是表征同一被测量的各个独立测量列算术平均值分散性的参数,可作为算术平均值不可靠性的评定标准。
由推导可知,在n次测量的等精度测量列中,算术平均值的标准差为单次测量标准差的。测量次数n越大,算术平均值越接近被测量的总体均值,测量准确度也越高。这就是
我们通常取多次测量的平均值作为结果的原因。但是测量次数n值的增大必须付出较大的成本,当测量次数n>10时,随n值的增大,算术平均值的标准差变化不大,因此一般测量次数取n=10以内较为适宜。可见,要提高测量准确度,应采用较高准确度的测量仪器并选用适当的测量次数。
统计上允许的合理误差极限一般为±3σ。
2.平均误差
该误差形式的缺点是无法体现各次测量值之间的离散情况,因为不管离散大小,都可能有相同的平均误差。
3.或然误差
在一组测量中,测量值的误差在-γ~0之间的次数与在0~+γ之间的次数相等,即
则γ便称为或然误差。
根据定义,或然误差的求法是:将一组n个测量值的残差分别取绝对值按大小依次排列,如果n为奇数,则取中间者;如果n为偶数,是取最靠近中间的两者的平均值,故γ又称为中值误差。
标准差与平均误差、或然误差有如下关系:
4.范围误差
一系列测量中的最大值与最小值之差,即误差限(范围)。
显然,该误差只反映了误差限,而并没有反映测量次数的影响,体现不了误差的随机性及其概率。
上述误差的各种表示形式,有的已不多用,甚至基本不用,最常用的是标准差,并已成为测量结果的标准不确定度的表征量。
四、测量误差的传递
(一)间接测量的误差
在实际工作中,经常会遇到间接测量,即根据一些直接测量的结果按一定的关系式去求得被测量的量。于是,便出现了关于间接测量的误差问题。
为了简便,设各项误差都是相互独立的,即不相关的;否则便需要引进所谓的相关系数。对于一般的测量误差,通常皆可按独立误差处理。
设间接测量结果y由直接测量xi所决定,即
y=f(x1,x2,…,xn)=f(xi)
令Δxi为xi的误差,Δy为y的误差,则
y+Δy=f(x1+Δx1,x2+Δx2,…,xn+Δxn)
将上式右侧按泰勒级数展开,并略去高次项,于是可得如下的绝对误差和相对误差:
(二)测量误差的合成
在实际计量测试中,对一个被测量来说,往往可能有许多因素引入若干项误差,应将所有误差合理地合成起来。
比较常见的测量误差合成方法有下列几种。这里,为了简便,设各项误差是彼此独立的。其实,通常的测量误差,往往都可看成是不相关的,即相互独立的。
1.代数和法
将所有误差取代数和:
式中 e——合成误差;
ei——分项误差;
n——误差的项数。
2.绝对值和法
将所有误差按绝对值取和,即
该法完全没考虑误差间的抵偿,是最保守的,但也是最稳妥的。
3.方和根法
取所有误差的方和根,即
该法充分考虑了各项误差之间的抵偿,对随机性的误差,较为合理,也比较简单。但当误差项较少时,可能与实际偏离较大,合成误差估算值偏低。
4.广义方和根法
将所有误差分别除以相应的置信系数ki,再取方和根,并乘以总置信系数k,即
该法考虑了各随机误差的具体分布,具有通用性和合理性。但需要事先确定与误差相应的置信系数,往往比较麻烦。
上述的各种测量误差的合成方法,在具体应用时,必须根据各分项误差性质与大小,酌情而定。
(三)微小误差准则
在做误差合成时,有时误差项较多,同时它们的性质和分布又不尽相同,估算起来相当烦琐。如果各误差的大小相差比较悬殊,而且小误差项的数目又不多的话,则在一定的条件下,可将小误差忽略不计。该条件称为微小误差准则。
1.系统误差的微小误差准则
系统误差合成时,设其中第k项误差ek为微小误差。根据有效数字的规则,
当总的误差e取一位有效数字时,若ek =(0.05~0.1)e,则ek便可忽略不计;
当总的误差e取二位有效数字时,若ek <(0.005~0.01)e,则ek便可忽略不计。
2.随机误差的微小误差准则
随机误差合成时,设其中第k项误差ek为微小误差,并令。根据有效数字的规则,当总的误差e取一位有效数字时,有
e-e′<(0.05~0.1)e
e′>(0.9~0.95)e
(e′)2> (0.81~0.9025)e2
e 2-(e′)2=ek2<(0.0975~0.19)e2
于是
ek<(0.436~0.312)e
或近似地取
ek<(0.4~0.3) e
即当某分项误差ek约小于总误差e的l/3时,便可忽略不计。
当总的误差e取二位有效数字时,有
e-e′<(0.005~0.01)e
最后可得
ek=(0.14~0.1)e
即当某分项误差ek约比总的误差e小一个数量级时,便可将其忽略。