计量技术与管理工作指南
上QQ阅读APP看书,第一时间看更新

第二节 概率统计

概率统计是研究和揭示计量测试中随机现象统计规律的必不可少的数学工具。本章除了介绍随机事件及其概率、随机变量及其数字特征量、样本和统计量等基本概念外,还介绍了数据处理中常用的分布及其数字特征量。

一、随机事件和概率

(一)随机现象和随机事件

1.随机事件定义

在自然界和人类社会活动中经常遇到一类现象:在一定条件下事件可能出现的结果不止一个,但至于出现哪一个事先无法确定,这就是随机现象,也叫偶然现象。例如,测量标称值9.5mm的0级量块长度尺寸,其测值可能是9.38mm与9.62mm之间的任何值,这在测量之前是没法确定的。对随机现象进行一次观察或实验,称为随机试验(用E表示)。随机试验的每一个可能结果称为E的一个基本事件,用ω表示。例如,测量该量块长度值为9.45mm,就称为测量量块长度的一个基本事件。随机试验的全部基本事件组成的集合称为该随机试验的样本空间,记为Ω=(ω)。随机试验需具备如下条件:

1)可以在相同条件下重复。

2)全部可能结果有多个,这些可能的结果在试验前能明确知道。

3)每次试验可能的结果唯一,并且在试验前无法预知。

实际上,人们常关心的是试验结果中的某一部分,例如,测量该量块长度尺寸的标准偏差≤0.01μm;如果该量块长度尺寸(约定)真值已知,则测量该量块长度尺寸的偏移(算术平均值与真值之差)≤0.1μm;测量该量块长度尺寸值在9.38mm与9.62mm之间等,这些试验全部可能结果中的某一部分称为一个随机事件,用大写字母AB、…来表示。

A={测量量块长度尺寸的标准偏差≤0.01μm};

B={测量量块长度尺寸的偏移≤0.1μm};

C={测量量块长度尺寸值在9.380mm与9.620mm之间}。

2.事件的基本关系

事件之间的关联可以用以下几种基本的关系来表示。

1)若AB至少有一个发生(把它作为一个事件),则称为AB的和(事件)或并(事件),记作AB,也可记为A+B。如图3-4a所示。

2)把“AB都发生”作为一个事件,则称为AB的交(事件)或积(事件),记作AB,也可记作AB,如图3-4b所示。

3)“A发生而B不发生”作为一个事件,称为AB的差(事件),记作A-B。如图3-4c所示。

图3-4 事件的和、积、差

4) A发生,必然导致B发生,则称A含于B,记作AB;或称B包含A,记作BA。如图3-5a所示。

5)若AB满足AB=ΦΦ为不可能事件)且AB=SS为必然事件),则称AB互为对立事件,记作。如图3-5b所示。

6)AB不能同时发生,即AB=Φ,则称AB互斥,或称AB互不相容。如图3-5c所示。

图3-5 事件的包含、互逆与互斥

(二)事件的概率

1.概率的频率定义

设某试验E的样本空间为SAE的一个事件。把试验E重复进行n次,在这n次试验中事件A发生的次数m称为事件A的频数。比值:

称为事件An次试验中发生的频率。

实践表明当试验次数n很大时,P*(A)几乎稳定地接近于常数P,这种性质就叫频率的稳定性,它提供了一种可广泛应用于近似计算事件概率的方法。当试验次数充分大时,用频率来近似描述概率的方法称为概率的频率定义。

例如,对于某量块长度重复测量100次,其中有95次的数据出现在9.380mm 与9.620mm 之间,则称该事件{量块长度尺寸值为9.380mm与9.620mm之间}发生的概率近似为0.95。

2.概率的信任度定义

信任度是对事件发生的相信程度。当对事件发生全信时,信任度为1;当对事件发生全不信时,信任度为0;当对事件发生半信半疑时,信任度为1/2。只要可以根据实际情况估计出该事件的信任度,它也可以作为该事件发生的概率。

例如,某测量数据102是由读至小数后一位的原数四舍五入而来,则可以认为该数的原数为下面10个数中的任何一个数的信任度相同,即原数为下面10个数中的任何一个数的概率相同,即为等概率1/10。

101.5,101.6,101.7,101.8,101.9,102.0,102.1,102.2,102.3,102.4

根据ISO3534—1993,概率的现代定义为:随机事件带有的一个数,范围从0至1。它可以关联到一个事件发生的长期试验出现的频率或信任度。

3.概率的基本性质

设随机事件E的样本空间为Ω,对于每一个事件A,其概率P(A)满足下面的三条公理:

公理1:0≤P(A)≤l

公理2:对于必然事件S,有P(S)=1

公理3:对于相互间不可能同时出现的事件A1,A2,…,Ai…,有

P(∪ Ai)=∑P(Ai)

满足该条件的这些事件称为互不相容的事件。

事件的概率还有以下基本性质:

性质1:对任何事件A都有

性质2:若AB,则有如下的减法定理

P(B-A)=P(B)-P(A), P(A)≤P(B)≤l

性质3:对于任何两个事件AB,有如下的加法定理

P(AB)=P(A)+P(B)-P(AB)

特别是事件相互间不同时出现时,P(AB)=P(A)+P(B)。

性质4:对于任何两个事件AB,有如下的乘法定理

P(AB)=P(B)P(A|B)

式中 P(A|B)——事件B发生的条件下,事件A发生的概率(称为条件概率)。

特别当满足P(A|B)=P(A)时,称事件A与事件B相互间独立,有P(AB)=P(B)P(A)。

二、随机变量及其数字特征量

(一)随机变量

随机试验中,为了更好地分析和处理该试验的结果,需要将试验E的样本空间所包含的事件与数值对应起来。例如,测量标称值9.5mm的0级量块长度尺寸,对该量块重复测量8次,得到属于该测量样本空间Ω={ω}的8个基本事件如下:

必然事件S={ωω1 (测量值为9.45mm),ω2 (测量值为9.52mm),ω3 (测量值为9.54mm),

ω4 (测量值为9.48mm),ω5 (测量值为9.47mm),ω6 (测量值为9.49mm),

ω7 (测量值为9.50mm),ω8 (测量值为9.48mm)}

用一个随机变量X来表示这8个基本事件的可能取到的测量值,则有

X(ω)={9.45mm(当ω1发生),9.52mm(当ω2发生),9.54mm(当ω3发生),

9.48mm(当ω4发生),9.47mm(当ω5发生),9.49mm(当ω6发生),

9.50mm(当ω7发生),9.48mm(当ω8发生)}

随机变量就是定义在随机试验样本空间Ω={ω}上的一个单值实函数,记作X=X(ω),简记为X

(二)随机变量的概率密度分布

引入随机变量X后,关心的问题是:X有可能取哪些值?X以多大的概率在任意指定范围内取值?这就是随机变量的概率分布问题。例如,重复测量某量块的长度尺寸时,作为该量块长度尺寸的测量结果所取的可能值是充满某个区间的。我们关心测量结果落在该区间的概率是多少?

定义:随机变量X的分布函数为F(x)=P(Xx),如果存在一个非负可积函数f(x),使对任意的实数x,均有

则称X是连续型随机变量,称f(x)是X的概率密度函数。概率密度曲线f(x)完好地描述了随机变量统计规律。易知,f(x)有下列两个性质:

式中 axb——置信区间;

P(axb)——置信概率(在测量不确定度评定中又称包含概率),简记符号p

α——显著性水平(又称弃真概率)。

它们的几何意义如图3-6所示。

图3-6 概率密度函数曲线与概率分布函数

在计量测试工作中,具体研究的随机变量就是与测量总体对应的随机误差。在实际相同的测量条件下,即使不存在系统误差和粗大误差,多次重复测量同一量,测得值也不尽相同,这是因为测值中含有不可避免的随机误差的缘故。随机误差的单次出现是无规律可循的,但通过大量的重复测量,其误差的总体都遵循一种统计分布的规律。这种规律就是用随机变量的概率密度函数及其分布函数来描述的。在计量测试的数据统计处理中常用到正态分布及其派生出来的一些重要统计量分布,如χ2分布、t分布和F分布。以下简单描述这几个分布的概率密度函数。

1.正态分布

连续随机变量X服从正态分布,其概率密度函数为

式中σμ为两个常数,σ>0。记XN(μσ2),其概率密度曲线如图3-7所示。正态分布曲线具有两个基本特性:

1)对称性:以x=μ为对称轴呈现中间高、两边低的钟形,称μ为位置参数。

2)单峰性:在x=μ处有最大概率,σ越小,图形的峰越高,且越陡峭,称σ为形状参数。

2. χ2分布

X1X2,…,Xn相互独立,均服从N(0,1),则称随机变量服从自由度为nχ2分布,记为χ2 (n),概率密度分布如图3-8所示。

图3-7 正态分布概率密度函数曲线

图3-8 χ2分布概率密度函数曲线

3. t分布

XN(0,1),Yχ2(n),且它们相互独立,则称随机变量服从自由度为nt分布,记为Tnt(n),其概率密度分布如图3-9所示。

图3-9 t分布概率密度函数曲线

t分布具有如下两个基本特性:

1)t分布的概率密度具有对称性(关于x=0轴对称)。

2)n→∞时,t分布的极限概率分布是标准正态分布。

4. F分布

Xχ2(m),Yχ2(n),且它们相互独立,则称随机变量服从第一自由度为m,第二自由度为nF分布,记为Fm,nF(m,n),其概率密度分布f(F)如图3-10所示。

图3-10 F分布概率密度函数曲线

(三)随机变量的数字特征

对于随机变量X,如果知道了它的概率分布,便知道了X取值的全面情况。但在许多问题中,更希望概略地掌握随机变量取值的某些重要特征。例如,在测量某物体长度时,测量结果是一个随机变量。实际工作中,常用多次测量的平均值作为该物体长度,并用标准差来衡量多次测量值的分散程度。随机变量取值的平均值与标准差是随机变量的两个最重要的数字特征。此外,还有表示随机变量取值分布的对称性、峰态以及随机变量间相互依赖等方面特性的数字特征。以下分别描述。

1.数学期望

定义:设连续型随机变量 X的概率密度为 fx),若积分绝对收敛,即,则称它为X的数学期望或均值,记为EX)或μ

由定义可见,数学期望是反映随机变量取值的“平均大小”的数字特征,它的定义来自人们常说的平均概念。

数学期望有以下几个重要性质。

性质1:E(C)=CE(CX)=CE(X),其中C是常数。

性质2:若随机变量XY的数学期望存在,则X+Y的数学期望存在,且

E(X+Y)=E(X)+E(Y)

性质3:若随机变量XY的数学期望存在,且XY独立,则X·Y的数学期望存在,且

E(XY)=E(X)E(Y)

2.方差与标准差

数学期望表示了随机变量取值的平均大小,在很多实际问题中,还需要考虑随机变量取值的分散程度。很明显,用|X-E(X)|可以反映X的取值分散程度。但是|X-E(X)|仍然是个随机变量,因此用它的取值平均值(严格说为数学期望)即E|X-E(X)|来反映X的分散程度是最合适的。考虑到在数学处理上的方便,通常采用EX-E(X)]2来描述X的取值分散程度。

定义:设随机变量X的数学期望为E(X),若EX-E(X)]2存在,则称它为X的方差,记为D(X)或Var(X),即

称为X的标准差或均方差,记为σX)或σ,即:

方差具有如下重要性质。

性质1:D(C)=0,D(CX)=C2D(X),其中C是常数。

性质2:若随机变量XY相互独立,它们的方差都存在,则X±Y的方差也存在,且

D(X±Y)=D(X)+D(Y)

XY不相互独立,则

D(X±Y)=D(X)+D(Y)±20COV(XY)

式中 COV(XY)——协方差,它的定义在本节后文介绍。

本性质是第四章讨论误差合成、测量不确定度合成和传播公式来源的主要依据。

性质3:D(X)=EX-E(X)]2E(X-C )2,其中C是常数。

在测量中,可以用μ表示测量数据分布的“重心”,该“重心”与被测量的理想值之差反映测量系统误差的大小,即测量的正确度。用标准差σ表示测量的一种“重复性”“复现性”“稳定性”和“测量标准不确定度”等。图3-11所示的三条分布曲线,表明三者测量的标准差相同,但测量的正确度不同;图3-12所示的情形恰好相反。

图3-11 数学期望的意义

图3-12 标准差的意义

3.三阶中心矩与偏态系数

定义:三阶中心矩

为了消除三阶中心矩单位量纲的影响,定义偏态系数为

偏态系数γ3是描述随机变量分布对称程度的一个数字特征。显然,正态分布具有零偏态性质,即γ3=μ3=0,它的密度分布曲线是关于x=μ对称的。如图3-13所示,当γ3>0时称为具有正偏态,γ3<0时称为具有负偏态。在有的场合,也称γ3为偏度。

图3-13 偏态系数的意义

4.四阶中心矩与超越系数

四阶中心矩μ4和超越系数γ4的定义如下:

比较几种常见分布的μ4σ4γ4的数值可见,它们表征了随机分布的峰凸程度。μ4σ4是将μ4无量纲化,而γ4是按标准正态分布归零的结果。也就是说,对于正态分布,超越系数γ4视为零;与正态分布比较,较尖峭的分布有,较平坦的分布有γ4<0(如三角分布的 γ4=-0.6,均匀分布的 γ4=-1.2,两点分布的 γ4 =-2.0 )。图 3-14 中的Ⅰ、Ⅱ、Ⅲ依次表示标准正态分布、分布和均匀分布的峰凸情形。在有的场合,也称γ4为峰度,或称μ4/σ4为峰态系数。

图3-14 超越系数的意义

5.协方差和相关系数

对于二维随机变量(XY),它的分量XY的数学期望E(X)、E(Y),方差D(X)、D(Y)只能反映每个分量取值的平均大小和取值的分散程度,它们不能反映XY之间联系的程度。这里,再引入协方差和相关系数概念。

(1)协方差 对于两维随机变量(xy),fxy)为它们的概率密度曲线,如下积分表示了两变量间的相关联系

式中

COV(xy)称为变量xy的相关矩(或协方差)。当两个变量的相关矩不等于零,表示它们之间存在一定的联系,即指f(xy)是不可分离的。

(2)相关系数 由式(3-25)可知,相关矩不仅表征变量之间的关联性,而且还表征它们关于一阶原点矩的偏差情况。事实上,譬如量xy中之一与一阶原点矩的偏差极小,那么两个量之间无论有多么密切的联系,它们的相关矩永远是小的。所以为了纯粹地表示量xy之间的联系,将相关矩COV(xy)除以σxσy,这样得到的无量纲的量称为相关系数,记为ρ

可以证明

ρ>0,称xy正相关,当ρ<0,称xy负相关。图3-15表示了四种实验统计的结果,它们分别是线性相关、正相关、负相关和实际的不相关。

图3-15 相关系数的意义

相关系数表示了两个变量间的线性相关程度,而不反映它们之间的其他关联性质。在测量误差理论中,常用ρ来表征测量因素x对被测量y的线性关联的程度。在讨论线性回归和相关性检验等问题时,都要涉及相关系数和协方差计算的问题。

三、样本和统计量

(一)基本概念

在数理统计中,把研究对象的全体称为总体,把组成总体的每一个元素称为个体。抽样就是从总体X中随机抽取一定数量的个体,如(x1x2,…,xn),这组个体称为容量为n的一个样本。若x1x2,…,xn相互独立且每个分量xi与总体X有相同的分布,则(x1x2,…,xn)又被称为简单随机样本。数理统计的任务就是根据样本(x1x2,…,xn),对总体X的分布及其数字特征进行估计与推断。因而要求样本尽可能有代表性,即抽样要满足

1)总体中每个个体被抽得的机会均等。

2)从总体中抽取有限个个体后,总体的分布不变。

从总体X中,抽取样本(x1x2,…,xn)后,为了根据对样本的分析与研究去估计、推断总体X的分布与数字特征,往往需要将样本(x1x2,…,xn)进行加工整理,构造出关于样本的不含任何未知参数的连续函数φ(x1x2,…,xn),这种函数就称为统计量。

前面内容提到的χ2分布、t分布和F分布就属于统计量的分布。另外,常用的统计量大多是样本的一些数字特征量,如,样本均值、样本方差、样本偏态系数、样本超越系数、两个变量间的样本相关系数等。这些统计量,在计量工作中都有重要的应用。为了引入几个常用的统计量公式,先不加证明地引入如下的几个有关统计量分布的重要结论。

(二)样本均值和样本方差及其分布

在测量工作中,常要用到以下三个统计公式,它们分别是总体X的样本均值、样本方差s2和样本均值的标准偏差

例如,样本均值常用作同一测量条件下的测量结果,样本方差s2常用作评价某个测量仪器的重复性或测量方法的精密度,样本均值的标准偏差常用作评价测量结果的重复性。有时式(3-29)用算术平方根的形式来表示,称之为贝塞尔(Bessel)公式。以下的第一个定理可以验证这三个估计是一种最佳的估计。

定理1:设总体X为任何分布,只要E(X)=μD(X)=σ2存在,则有

定理2:设总体XNμσ2),(x1x2,…,xn)为来自总体的一个样本,其样本均值和样本方差分别s2,则有

1)s2相互独立。

2),此结论用于多次测量取平均值以减小随机误差。

3),此结论用于样本标准差的区间估计。

4),此结论用于已知σ测量结果的区间估计。

5),此结论用于测量结果的区间估计。

定理3:设有两个总体:,其样本为(x1x2,…,),样本均值为,样本方差为s12YNμ2),其样本为(y1y2y3,…,),样本均值为,样本方差为。两样本相互独立,则有:

1),此结论用于两组样本差异显著性的正态分布检验。

2),此结论用于χ2检验。

3),此结论用于F检验。

4)当时,,其中,此结论用于两组样本差异显著的t分布检验。

四、测量统计实例

(一)常见分布及其数字特征量

1.正态分布

在实际测量中,经常遇到一类服从正态分布的随机误差。它产生的特征是,测量误差源很多,又没有一个是明显的。正态分布正是由这么多微小、相互独立的因素综合影响测量结果的一种随机测量分布。这一事实早已被概率论的中心极限定理所证明。

依照正态分布的统计规律,其概率密度函数为

测量值x在以μ为中心的分布区间[μ-kσμ+]的置信概率

式中

测量在一定置信概率下的误差分布界限或极限误差用区间半宽度表示如下

图3-16表示了三种大小不同的分布区间的置信概率。一些常用置信因子k对应的置信概率p见表3-3。

表3-3 常用置信因子k对应的置信概率p

其中μσ分别为数学期望和标准差,μ反映测量值的大小,σ反映测量值的分散性大小。正态分布可记为XN(μσ2)。当μ=0,σ=1时,称为标准正态分布,分布函数简化为

习惯上,记

实际应用时,Φ(x)的值可查标准正态分布积分数值表。

例,设XN(μσ2),求落在区间(μ-kσμ+)内的概率,其中k=1,2,3。

解:

P{| X-μ|≤}=P{μ-kσXμ+}

=Φ(k)(-k)=Φ(k)-[1(k)]=2Φ(k)-1

上式利用了正态分布性质

k=1,2,3分别查标准正态分布积分数值表得

P{| X-μ|<1σ}=2Φ(1)-1=0.6856

P{| X-μ|<2σ}=2Φ(2)-1=0.9544

P{| X-μ|<3σ}=2Φ(3)-1=0.9973

计算结果如图3-16所示。

图3-16 正态分布

从上面的分析可以看出,由于正态变量在(μ-3σμ+3σ)内取值的概率已达到99.73%,因此可以认为变量X落在区间(μ-3σμ+3σ)以外的可能性极小,是小概率事件。这在数据处理和工程应用中称为“3σ准则”。

2.均匀分布

若测量值在某一范围中出现的机会一样,即均匀一致,则可认为测量值服从均匀分布,如图3-17所示。测量值x服从[a-,a+]上均匀分布的概率密度函数为

其期望和标准差分别为

根据实际经验,服从均匀分布的测量的可能情形有:①数据切尾引起的舍入误差;②电子计数器的量化误差;③摩擦引起的误差;④仪器度盘或齿轮回程误差;⑤平衡指示器调零不准引起的误差;⑥李沙育图形不稳定引起的误差;⑦数字示值的分辨力限制引起的误差;⑧滞后误差。

图3-17 均匀分布

3.三角分布

若测量值x分布的概率密度函数为

则称测量值x服从三角分布,如图3-18所示。其期望与标准差分别为:

图3-18 三角分布

三角分布可作为等腰梯形分布的特殊情况,通常在两次相同均匀分布相加取平均后可视为三角分布。

4.反正弦分布

若测量值x服从如下概率密度分布

则在(-aa)上服从反正弦分布,如图3-19所示。其期望和标准差分别为

图3-19 反正弦分布

根据实际经验,服从反正弦分布的可能情形有:①度盘

偏心引起的测角误差;②正弦(或余弦)振动引起的位移误差;③无线电中失配引起的误差。

5.投影分布

测量时由于安装调整的不完备,对测量结果会带来偏差δ。比如,在长度测量中,常需要用激光或标准尺测量被测件,激光光线或标准尺l′总会偏离测量线l一个β角,如图3-20所示,则造成测量偏差δ有如下的投影分布关系

δ=l-l′=l-lcosβ=l(1-cosβ)

在实际研究中,β在较小的范围[-AA]内常服从均匀分布U-AA],如图3-21所示,则投影分布的概率密度如下

其期望和标准差分别为

E(σ)=A2/6=Δ/3 (Δ=A2/2),σ=3Δ/10

图3-20 基线偏离β角造成的测长误差

图3-21 投影分布

在仪器的安装调整中广泛存在投影分布误差,可见它关于偏角是个二阶小量。

在实际工作中,常要用到以上几种常见分布的数字特征量,特别是不同分布的区间半宽度与标准差的倍数关系,现归纳见表3-4。

表3-4 常见分布的数字特征量

(二)数字特征量的估计

在测量实际工作中,当不知道测量总体的数字特征量时,则常常设法通过一组测量样本数据,来获得该测量总体数字特征量的好的估计。以下分别给出它们的估计方法。

在概率论中,称E(X)为随机变量X的一阶原点矩(数学期望),在数理统计中,则称样本均值X的一阶样本原点矩。用估计EX)的方法称为数学期望的矩估计法。根据前述的定理1,EX)的最佳估计。

,…,是将样本数据自小到大整序后的数据序列,显然,也可以用该样本中位数

来估计测量总体X的数学期望。用估计EX)的方法称为数学期望的顺序统计量估计法。该方法的优点是可以简化试验或计算,不易受个别异常数据的影响,稳健性最好,但对估计的信息利用不充分。理论分析表明,在均匀分布的情况下,采用所估算的标准差要小。但是在接近正态分布的情况下,一般还是用作为期望的估计值。

类似地,在数理统计中常用Bessel公式[式(3-29)]得到样本方差来估计测量总体X的方差,而且可以证明s2σ2=EX-μ2的无偏估计。

,…,是测量总体的样本顺序统计量,由于

带来总体X取值离散程度的信息,因此也可以用R作为对总体X的标准差σ的估计,称R为样本极差。当总体XN(μσ)时,σ的估计可取为

其中dn值见表3-5。

极差法的优点是计算简便,但当n较大时,与用s估计的可靠程度的差异变大。这时,一般不用极差估计。推荐在n≥6时,用贝塞尔公式,即式(3-29 )估计s,而在2≤n≤5时,用极差公式,即式(3-36 )估计σ。而当要估计样本均值的标准偏差时,则用

表3-5 极差法估计系数

(三)数字特征量的区间估计

以上通过样本值x1x2,…,xn获得的测量样本的数字特征量,只能是对测量总体的数字特征量的一种近似估计,样本不同所得的估计值也不同。为此,需要考虑估计量的置信区间。

根据数理统计的知识,即由定理2的5)可以得到,在测量总体服从正态分布的情况下,用样本均值近似数学期望的置信区间

也就是测量结果的区间估计可以用下式表示

式中ta(n-1)值可通过查t分布表得到。在实际测量中,可以通过采样得到的数据,用式(3-37)来评价测量总体数学期望的区间估计范围,用于考察仪器在特定条件下允许误差极限的技术性能是否发生显著变化。

根据数理统计的知识,即由定理2的3)可以得到,在测量总体服从正态分布的情况下,统计样本标准差的置信区间

式中值可通过查χ2分布表得到。在实际测量中,可以通过采样得到数据,用式(3-39 )来评价测量总体标准差的区间估计范围,用于考察仪器的测量重复性、复现性、稳定性是否合格。