3.3 均值与方差的点估计
在实际问题中,根据子样的数据,计算出的子样特征数与S2,通常用来作为相应总体特征数的估计量。对于服从正态分布的总体,均值为μ,方差为σ2(参见2.6节)。当子样是从一正态分布的总体中随机抽出的一部分时,可用子样平均值去估计该总体的均值μ,而用子样方差S2去估计总体方差σ2,这在数理统计中称为点估计,即
其中,“^”为估计量的符号。用子样特征数去估计总体特征数,很重要的一点是前者为后者的无偏估计量。也就是说,当用 作为 或用S2作为 时,子样特征数应满足这样的要求,即它的数学期望(统计平均)应当等于它所估计的参数本身,即
这个要求称为无偏性。
我们通常计算的算术平均值是满足这个要求的。根据概率论中数学期望的性质,有
由于x1,x2,…,xn相互独立,都是随机变量x的估计值,因此,可把子样值xi看成是一随机变量,且与随机变量x有相同的理论分布和理论均值μ。于是,式(3-7)变为
至此,式(3-5)得证。该式表明,子样均值 是总体均值μ的一个无偏估计量。
所谓无偏估计,当然不是说用无偏估计量来估计不产生偏离,只是说由于子样数据算出的估计值离被估计值很近,由不同子样得到的估计值在被估计值附近波动,大量估计值的平均值能够消除估计值对被估计值的偏离。正是根据子样平均值是总体均值的无偏估计值这一观点,重复测定某一物理量,如测定值的分布服从正态分布,则算术平均值即为一组等精度测量中的最佳值或最可信赖值。换句话说,算术平均值很接近真值μ(总体均值)。可以证明,算术平均值与测定值偏差的平方和最小。
设有一不等于算术平均值的任一数A,则必有
对式(3-9)的证明如下:
由式(3-9)左边得
移项得
因A≠ ,又n是正整数,则必有
即
所以
于是,式(3-9)得证。
子样平均值可作为总体均值μ的最佳估计值,这只给出了问题的一个方面。一般来说,子样均值并不等于总体均值μ。换句话说,用去估计μ是有误差的。人们往往对这一方面也是很关心的,所以有必要介绍以下平均值的标准差。
下面根据概率论中方差的性质来进行推导:
由于x1,x2,…,xn相互独立,都是随机变量x的估计值,与随机变量x具有相同的分布和理论方差σ2。因此,式(3-11)变为
该式表明,算术平均值的方差是该总体方差σ2的1/n。由式(3-12),得
即平均值的标准差 是平均值方差的开平方。通常,总体标准差σ是未知的,所以算术平均值的标准差常用下式表示,即
这个公式表明了平均值的标准差与子样标准差S的关系。当标准差S不变时,n增大,算术平均值的标准差减小,即用作为估计的精度高。这个结论给我们以启示,在分析测定时,测定次数(子样容量)n不能太小,否则算术平均值的误差将增大。但要注意,对于式(3-14),S不变时,n>5以后,子样均值的标准差随n的增大而减小得很慢。这就是说,单靠增加观测次数来提高实验的精密度是不够的。这就意味着,要把更多的精力用来改进测试技术,往往比重复老一套的测试精度不高的测量更有意义。因此,在实际测定某一量时,由于多方面条件的限制,重复测定的次数n很少超过50次,一般在4~20次左右。
下面来证明式(3-6),由式(3-2)
同式(3-10)的推导类似,有
根据概率论中数学期望的性质、方差的定义及式(3-12),有
由于σ2的估计量S2的数学期望,等于被估计参数σ2的本身,这就证明了S2是σ2的无偏估计量。