第五节 检测次数的选择
在统计检验中,检测次数或测量次数n,是一个很重要的量,一般n取得愈大愈好。在显著性水平a值已确定时,n值大,易于检出较小的差异;当差异大小值已确定时,n值大,则可提高可信水平,减少犯第Ⅰ类错误和第Ⅱ类错误的概率。但n取得太大,则造成人力、财力、物力的浪费。因此,如何确定最低限度的n值,在实际工作中显得很重要。以下我们介绍在评定两组检测结果时,如何确定n值。
一、用标准()来评定一组检测结果()时,检测次数的确定
(一)比较与之间是否存在显著性差异
1.总体标准偏差σ未知时
(1)选定显著性水平a值及犯第Ⅱ类错误的概率β值。
(2)确定希望检出的与之间的差的绝对值。
(3)求总体标准偏差σ的估计值。可用两种方法得到:
①通过已有的实验数据计算。
②用以下简单的方法估算:
(4-20a)
a1和b1为设定的两个值,我们希望有99.7%的检测数据落在a1~b1的范围内,或:
(4-20b)
a2和b2为设定的两个值,我们希望有95%的检测数据落在a2~b2的范围内。
(4)按式(4-2)计算d值:
(4-21)
(5)查表4-15,根据已选定的a值及β值,查得相应的n值,如a=0.01,应将此n值加4,如a=0.05,应将此n值加2,得到所需要的测定次数n。也就是说,至少要做n次测定,与之差的绝对值才能不超过设定的值,如测定结果实际上等于或超过设定的值,则在选定的a和β值下,可认为该组数据所求得的平均值不可靠。
表4-15 确定测定次数(n)的临界值(双侧检验)
例4-17 现需要评定用某一检测方法求得的平均值()与经典的检测方法求得的平均值()之间是否存在显著差异。要求检验用这两种检测方法得到的结果之差应不超过0.0024。问:每种方法至少需平行测定多少次?
解:
(1)选定显著性水平a=0.05,犯第Ⅱ类错误的概率β=0.30。
(2)根据题意要求两种检测方法得到的结果之差不超过0.0024。
(3)因总体标准偏差σ未知,且假定我们希望有97.5%的检测数据落在宽度为0.024的范围内,故用式(4-20b)估算σ:
(4)按式(4-21)计算d:
查表4-15:a=0.05,1-β=0.70,d=0.6,查得n=18,n+2=20,故需要平行测定20次,才能达到要求。即至少每种检测方法要平行测定20次,才可使两组平均值之间的差,在a=0.05,β=0.30下,不超过0.0024。
2.总体标准偏差σ已知时
(1)选定显著性水平a值及犯第Ⅱ类错误的概率β值。
(2)确定希望检出的与之间的差的绝对值。
(3)按式(4-21)计算d值。
(4)查表4-15,据已选定的a值及β值,查得相应的n值,此值即为需要的测定次数。
例4-18 一种测碳的检测方法,方法的总体标准偏差σ为0.34%。现在要求能检出一个检测人员测定一标样的含碳量()与标样值()之差不超过0.4%。问:他至少要平行测定几次才能达到要求?
解:
(1)选定显著性水平a=0.05,犯第Ⅱ类错误的概率β=0.10。
(2)根据题意要求:不超过0.4%。
(3)按式(4-21)计算d:
(4)查表4-15:a=0.05,1-β=1-0.10=0.90,d=1.2,查得n=8。
故这个检测人员需要对标样做8次平行测定,才能使他的检测结果与标准值的差不超过0.4%。
(二)比较检测结果是否比要大,或者比要小时检测次数的确定
1.总体标准偏差σ未知时
(1)选定显著性水平a值及犯第Ⅱ类错误的概率β值。
(2)确定希望检出的比要大的数值δ:
(4-22)
(3)用本节中前面介绍过的两种方法,求总体标准偏差σ的估计值。
(4)按式(4-21)计算d值。
(5)查表4-16,根据已选定的a及β值,查得相应的n值,如a=0.01,应将此n值加3,如a=0.05,应将此n值加2,即得到所需要的测定次数n。
表4-16 确定测定次数(n)的临界值(单侧检验)
例4-19 用容量法标定一高锰酸钾溶液,今给出溶液的浓度为0.1157mol/L,问:至少标定几次,才能使标定的结果()为0.1158mol/L,要求检测结果中有95%的数据是落在0.1155~0.1159mol/L的范围内。
解:
(1)选定a=0.01,β=0.20。
(2)按题意要求。
(3)按式(4-20b)估算σ:
(4)按式(4-21)计算d:
(5)查表4-16:a=0.01,1-β=0.80,d=1.0,查得n=11,n+3=14。
故至少需要平行测定14次,才能达到要求;如平行测定14次,求得的平均值等于或大于0.1158mol/L,则在a=0.01,β=0.20下,认为该数据不可靠。
用相同的方法也可检验是否小于,只是此时计算δ及d应分别改用以下两式:
(4-23)
(4-24)
例4-20 仍用例4-19中的溶液,要求也与例4-19相同。问:至少平行测定几次,才能使测得的检测结果()大于0.1156mol/L?
解:
(1)选定a=0.05,β=0.30。
(2)按式(4-23)计算δ:
(3)同例4-19,σ=0.0001。
(4)按式(4-24)计算d:
(5)查表4-16:a=0.05,1-β=0.70,d=1.0,查得n=5,n+2=7。
故至少需要测定7次,才能达到要求。
2.总体标准偏差σ已知时
(1)选定显著性水平a值及犯第Ⅱ类错误的概率β值。
(2)按式(4-22)确定希望检出的比要大的数值δ。
(3)按式(4-21)计算d值。
(4)查表4-16,据已选定的a及β值,查得相应的n值,此值即为需要的测定次数n。
例4-21 有一测铬的检测方法,其方法精度为0.25%,一熟练的检测人员用此方法对含量为10.80%的铬标样进行检测,欲使测得的比大的数值δ小于0.20%。问:需要平行测定几次?
解:
(1)选定显著性水平a=0.05,β=0.30。
(2)根据题意:δ=-=0.20%
(3)按式(4-21)计算d值:
(4)查表4-16:a=0.05,1-β=0.70,d=0.80,查得n=8;故需要平行测定8次,才能达到要求。
用相同的方法也可检验是否小于,只是此时计算δ及d应分别改用式(4-23)及式(4-24)。
二、评定两组检测结果与时检测次数的确定
(一)比较与之间是否存在显著差异
1.两组检测数据的总体精度σ1及σ2均未知,但认为它们是一致(σ1≈σ2)时
(1)选定显著性水平a值及犯第Ⅱ类错误的概率β值。
(2)确定希望检出的与之间的差异的绝对值δ:
(4-25)
(3)用以上介绍过的方法[参见式(4-20a)及式(4-20 b)],求总体标准偏差σ的估计值。
(4)按下式计算d值:
(4-26)
其中σ=σ1≈σ2。
(5)查表4-15,据已选定的a及β值,查得相应的n值,如a=0.01,应将此n值加2;如a=0.05,应将此n值加1,即得到所需要的测定次数n(n=n1=n2),此时应小于δ,如,则在选定的a及β值下,认为该两组检测结果之间有显著差异。
例4-22 例4-6中所提到的那位检测人员,每天仍需标定一次盐酸,如果他想使自己两天的检测结果(和)之间的差异不超过0.0002mol/L,问:每天需要平行测定几次,才能达到这个要求?
解:
(1)选定显著性水平a=0.05,β=0.20。
(2)根据题意,希望检出的与之间的差异δ为0.0002mol/L。
(3)由于σ未知,需求出σ的估计值,在例4-6解中已求得标准偏差S=1.02×10-4,故以此值作为σ的估计值。
(4)按式(4-26)计算d值:
(5)查表4-15:a=0.05,1-β=0.80,d=1.4,查得n=5,n+1=6。
故每天需平行测定6次,才能达到检测结果的平均值与之间的差不超过0.0002mol/L,如实际得到的与之间的差等于或大于0.0002mol/L,则在a=0.05,β=0.20下,认为与之间有显著差异。
2.两组检测数据的总体精度σ1及σ2均为已知时
(1)选定显著性水平a值及犯第Ⅱ类错误的概率β值。
(2)按式(4-25)确定希望检出的与之间的差异的绝对值δ。
(3)如果希望用相同的测定次数取得两组检测数据,即n=n1=n2,则按下式计算d值:
(4-27)
(4)根据已选定的a、β值,可从表4-15中直接查得需要的测定次数n(n=n1=n2)。
(5)如果希望第一组的测定次数为n1,第二组的测定次数为n2,但n1=cn2,其中c为任意常数值,则按下式计算d值:
(4-28)
式中,c为以上n1=cn2中设定的常数值,根据已选定的a,β值及式(4-28)计算得的d值,从表4-15中直接查得所需要的第一组的测定次数n,即n=n1,第二组的测定次数为n2=n1/c。
例4-23 测定某元素有两种不同的检测方法,其中方法A的总体标准偏差σA为0.024%,方法B的总体标准偏差σB为0.033%,现用这两种检测方法测定相同试样,设希望两平均值之间的差小于0.04%,欲检验这两种检测方法所得的平均值之间是否存在显著差异,问:
①在n=nA=nB时,每种方法需平行测定多少次?
②在nA=0.5nB时,A、B两方法各需平行测定多少次?
解:
(1)选定显著性水平a=0.05,犯第Ⅱ类错误的概率β=0.30,1-β=0.70。
(2)按式(4-25)计算δ:
(3)计算d值:
①n=nA=nB时,按式(4-27)计算d值:
②nA=0.5nB时,按式(4-28)计算d值:
(4)查表4-15:a=0.05,1-β=0.70,
d=1.0时,查得n=7;
d=1.2时,查得n=5。
(5)结论:在n=nA=nB时,每种检测方法至少平行测定7次;在nA=0.5nB时,A方法需要平行测定5次,B方法则需平行测定nB=nA/c=5/0.5=10次。
(二)比较两组检测结果及,其中一组检测结果是否比另一组检测结果要大,令偏大的一组检测结果为,则检验是否大于
1.两组检测数据的总体精度均未知,但认为它们是一致(σ1≈σ2)时
(1)选定显著性水平a值及犯第Ⅱ类错误的概率β值。
(2)确定希望检出的比要偏大的值:
(4-29)
(3)按下式计算d值:
(4-30)
式中,σ=σ1≈σ2。式中的σ如果事先无法求得,则可按以前介绍的方法,计算它的估计值[参见式(4-20a)及式(4-20 b)]。
(4)查表4-16:据已选定的a及β值,查得相应的n值,如a=0.01,应将此n值加2,如a=0.05,应将此n值加1,即得到两组所需要的分别测定次数,即n=n1=n2。
例4-24 同例4-22,那位检测人员标定一瓶新配制的盐酸溶液,第一天他得到的盐酸浓度为0.1075mol/L,第二天他得到的盐酸浓度为0.1073mol/L。问:这个检测人员每天至少做多少次平行测定,才能检验第一天的检测结果()是否比第二天的检测结果()偏大值小于0.0002mol/L?
解:
(1)选定显著性水平a=9.05,犯第Ⅱ类错误的概率β=0.20,即1-β=0.80。
(2)按式(4-29)计算δ:
(3)同例4-22,以S作为σ的估计值,故σ=1.02×10-4,按式(4-30)计算d值:
(4)查表4-16:a=0.05,1-β=0.80,d=1.4,查得n=4,n+1=5。
故每天至少平行测定过五次,才能检验出第一天的检测结果是否比第二天的检测结果偏大值小于0.0002mol/L。
2.两组检测数据的总体精度均为已知时
(1)选定显著性水平a值及犯第Ⅱ类错误的概率β值。
(2)按式(4-29)确定希望检出的比要偏大的值δ。
(3)如果希望用相同的测定次数取得两组检测数据,即n=n1=n2,则按下式计算d值:
(4-31)
(4)根据已选定的a及β值,可从表4-16中直接查得需要的测定次数n(n=n1=n2)。
(5)如果希望第一组的测定次数为n1,第二组的测定次数为n2,但n1=cn2,其中c为任意常数,则按下式计算d值:
(4-32)
式中,c为以上n1=cn2中设定的常数值,然后再根据已选定的a、β值及式(4-32)计算得的d值,从表4-16中直接查得所需要的第一组的测定次数n1,即n=n1,第二组的测定次数为n=n1/c。
例4-25 用例4-23,欲检验用方法A测得的检测结果(),是否比用方法B测得的检测结果()偏大值小于0.04%。
①如n=nA=nB,每种方法需平行测定多少次?
②如nA=0.5nB,A、B两方法各需平行测定多少次?
解:
(1)选定显著性水平a=0.05,犯第Ⅱ类错误的概率β为0.30,即1-β=0.70。
(2)按式(4-29)计算δ值:
(3)计算d值:
①在n=nA=nB下,按式(4-31)计算d:
②在nA=0.5nB下,按式(4-32)计算d:
(4)查表4-16:a=0.05,1-β=0.70,
d=1.0,查得n2=5;
d=1.2,查得n1=4。
(5)结论:在n=nA=nB时,每种方法需平行测定5次;在nA=0.5nB时,方法A需要平行测定4次,方法B则需平行测定nB=nA/c=4/0.5=8次。
(三)成对试验得到的两组检测结果及,比较及所需要的试验对数n的确定
(1)选定显著性水平a值及犯第Ⅱ类错误的概率β值。
(2)按式(4-25)确定希望检出的与之间的差的绝对值δ。
(3)令成对数据之间的总体标准偏差为σ,此数值可由过去的大量实验求得[参见式(4-17)]或为已知值。
(4)按下式计算d值:
(4-33)
(5)查表4-16,据计算得的d值和已选定的a及β值,查得相应的n值,如a=0.01应将此n值加3;如a=0.05,应将此n值加2,即得到所需要的成对试验的对数n。
例4-26 用例4-13数据,若两人重新对该试样进行检测,希望检验他们的检测结果之间是否存在大于或等于0.030%的差异。
问:至少需要有多少个成对试验数据?
解:
(1)选定显著性水平a=0.01,犯第Ⅱ类错误的概率β=0.01。
(2)按式(4-25)计算δ值:
(3)由于σ未知,以实验值得到的Sd来估计σ,由例4-13解中得Sd=0.0133,故σ=0.0133;
(4)按式(4-33)计算d值:
(5)查表4-16:a=0.01,1-β=0.90,d=2.3,查得n=4,n+3=7。
故至少需要有7次的成对试验,才能检验出两人重新对该试样进行检测时所得的检测结果是否存在大于或等于0.030%的显著差异。