二 社会变项对普通话态度的影响:假设检验的相关理论
由于本研究所涉及的是定类变量与定距变量,因此可以用方差分析、相关分析等方法来检验定类变量对定距变量的影响,即社会变项对普通话态度的影响。“方言区”、“性别”、“年龄”、“母语”等是定类变量或定距变量,对普通话的主观评价都是定距变量,符合方差分析、相关分析中对数据类型的要求。
(一)方差分析(ANOVA)
方差分析技术最常用于分析来自实验设计的实验数据,也可以用来分析来自抽样调查的观测数据,在实际应用中,方差分析用来处理检验各种因素对一个因变量是否有显著的影响。通常自变量(控制因素或控制变量、影响因素)由定类尺度(Nominal)或定序尺度(Ordinal)测量,可以取两个或多个水平或分类;所要检验的对象称为观测因素(观测变量),因素的具体表现为水平,因素的每一个水平可以看作总体,在每个因素下得到的样本值,即为观测值。方差分析实质上是通过推断控制变量各水平下观测变量的总体分布是否有显著差异来实现其分析目的,而对观测变量总体分布差异是通过对各总体均值是否存在显著差异来推断的。根据控制变量个数可以将方差分析分成单因素方差分析、多因素方差分析和协方差分析。
本书主要讨论单因素方差分析,即研究一个控制变量的不同水平是否对观测变量产生了显著影响。其分析的具体步骤如下。
(1)提出原假设H0:原假设为“控制变量的不同水平对观测变量的总体均值无显著差异”。
(2)选择F统计量为方差分析的检验统计量,F=组间平方和/组内平方和。
(3)计算F检验统计量的观测值。如果F值显著大于1,则说明控制变量对观测变量造成了显著的影响,控制变量对观测变量造成的影响大于随机变量造成的影响,反之,则说明随机变量造成的影响大于控制变量造成的影响。
(4)计算检验统计量的p值,将计算所得的检验统计量的p值与给定的显著性水平α做比较。如果p值<α,则应拒绝原假设,可以认为控制变量的不同水平对观测变量的差异产生了显著影响;反之,如果p值>α,则应接受原假设,认为控制变量的不同水平对观测变量没有显著影响。显著性水平α有0.05和0.01两个水平,小于0.05可以认为有显著影响,小于0.01可以认为极有显著影响。
根据变量的类型,分析方言区、性别、母语对普通话态度的影响时采用方差分析方法。
(二)相关分析
相关分析是分析客观事物之间关系的数量分析方法,是分析事物之间相关关系最常用的工具,通过比较相关系数数值的大小,能精确地反映两个变量之间线性相关的强弱程度。具体计算步骤上,一般要先计算出样本相关系数的数值r;然后通过假设检验,对是否存在显著的线性关系进行判断。虽然算出了相关系数,但还不能判断两个变量之间是否存在线性关系,这就需要看相应的检验统计量的观测值和对应的p值。同样,遵循原假设一般为否定句原则,原假设H0为“来自样本的两总体无显著线性关系”,如果p值<α,则应拒绝原假设,认为两总体存在显著的线性关系;反之,则应接受原假设,认为两总体不存在相关关系。
另外,相关系数有不同的种类,应针对变量的类型进行正确选择。Pearson相关系数、Spearman等级相关系数和Kendall τ相关系数等是常用的相关系数,其中Pearson相关系数用来度量定距型变量间的相关系数,如收入和储蓄、身高和体重等变量,Spearman等级相关系数、Kendall τ相关系数都适用于定序型的变量,但Kendall τ相关系数是采用非参数检验的方法来实现的,一般适用于内部差异较大的数据。
根据文中变量的类型,分析年龄、本地生活时间与普通话态度的关系时采用相关分析方法,并且使用Pearson相关系数来度量。