Stata统计分析与行业应用案例详解(第2版)
上QQ阅读APP看书,第一时间看更新

4.2 实例二——独立样本T检验

4.2.1 独立样本T检验的功能与意义

Stata的独立样本T检验过程(Independent-Samples T Test)也是假设检验中最基本、最常用的方法之一。跟所有的假设检验一样,其依据的基本原理也是统计学中的“小概率反证法”原理。通过独立样本T检验,我们可以实现两个独立样本的均值比较。独立样本T检验过程的基本程序也是首先提出原假设和备择假设,规定好检验的显著性水平,然后确定适当的检验统计量,并计算检验统计量的值,最后依据计算值和临界值的比较结果做出统计决策。

4.2.2 相关数据来源

【例4.2】表4.2给出了A、B两所学校各40名高三学生的高考英语成绩。试用独立样本T检验方法研究两所学校被调查的高三学生的高考英语成绩之间有无明显的差别(设定显著性水平为5%)。

表4.2 A、B两所学校各40名高三学生的高考英语成绩

4.2.3 Stata分析过程

在用Stata进行分析之前,我们要把数据录入到Stata中。本例中有两个变量,分别是A学校高考英语成绩和B学校高考英语成绩。我们把A学校高考英语成绩变量设定为englishA,把B学校高考英语成绩变量设定为englishB,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作我们在第1章中已有详细讲述。录入完成后数据如图4.4所示。

图4.4 案例4.2数据

先做一下数据保存,然后开始展开分析,步骤如下:

进入Stata 14.0,打开相关数据文件,弹出主界面。

在主界面的“Command”文本框中输入操作命令,并按键盘上的回车键进行确认。本例中对应的命令如下:

    ttest   englishA   =   englishB,   unpaired

4.2.4 结果分析

在Stata 14.0主界面的结果窗口我们可以看到如图4.5所示的分析结果。

图4.5 分析结果图

通过观察分析结果,我们可以看出共有80个有效样本参与了假设检验,自由度为78,其中变量englishA包括40个样本,均值为135.175,标准差为11.70336,标准误为1.850463, 95%的置信区间是[131.4321,138.9179];变量englishB包括40个样本,均值为104.95,标准差为6.939112,标准误为1.09717,95%的置信区间是[102.7308,107.1692]。Pr(|T| > |t|) = 0.0000远小于0.05,需要拒绝原假设,也就是说,两所学校被调查的高三学生的高考英语成绩之间存在明显的差别。

4.2.5 案例延伸

上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。但是Stata 14.0的强大之处在于,它同样提供了更加复杂的命令格式以满足用户更加个性化的需求。

1.延伸1:改变置信水平

与单一样本T检验类似,例如我们要把显著性水平调到1%,也就是说置信水平为99%,那么操作命令可以相应地修改为:

    ttest     englishA=englishB, unpaired   level(99)

在命令窗口输入命令并按回车键进行确认,结果如图4.6所示。

图4.6 分析结果图

从上面的分析结果中可以看出与95%的置信水平不同的地方在于置信区间得到了进一步的放大,这是正常的结果,因为这是要取得更高置信水平所必须付出的代价。

2.延伸2:在异方差假定条件下进行假设检验

上面的检验过程是假定两个样本代表的总体之间存在相同的方差,如果假定两个样本代表的总体之间的方差并不相同,那么操作命令可以相应地修改为:

    ttest     englishA=englishB, unpaired   level(99)   unequal

在命令窗口输入命令并按回车键进行确认,结果如图4.7所示。

图4.7 分析结果图

可以看出在本例中同方差假定和异方差假定之间的结果没有差别。