2.3 典型题(含考研真题)详解
一、单项选择题
1.在探讨性别与被试年龄(青年、中年、老年)对某品牌手机偏好影响的研究中,其实验设计为( )。[统考2014研]
A.2×3设计
B.1×3设计
C.2×2设计
D.3×3设计
【答案】A
【解析】该实验使用性别2(男,女)×年龄3(青年,中年,老年)设计。
2.下表所示为一个有四种实验处理的设计方案。该研究设计属于( )。[统考2014研]
A.匹配设计
B.ABBA设计
C.拉丁方设计
D.混合设计
【答案】C
【解析】拉丁方以表格的形式被概念化,其中行和列代表两个外部变量中的区组,然后将自变量的级别分配到表中各单元中。简单的说就是某一变量在其所处的任意行或任意列中,只出现一次。
3.在某研究设计中,用方便分组的方式,将被试分为一个实验组和一个控制组,对两组均进行了一次前测和后测。该设计是( )。[统考2014研]
A.交叉滞后设计
B.时间序列设计
C.相等时间样本设计
D.不相等对照组设计
【答案】D
【解析】不相等对照组设计的实验模式是具有一个实验组和一个控制组,对两组被试均进行前测和后测验,以便于对照比较。
4.有研究发现,正常被试和遗忘症患者自由回忆的正确率之间存在显著差异,但XX辨认之间不存在显著差异。据此可知实验存在( )。[统考2014研]
A.期望效应
B.练习效应
C.习惯效应
D.交互效应
【答案】D
【解析】交互作用指自变量之间的相互关系,即当一个自变量产生的效果在第二个自变量的每一水平上不一样时,就发生交互作用。A项,期望效应指被试的表现因为逐渐熟悉实验情境而有系统地提升。B项,习惯效应指被试的表现因为连续作业的疲劳而系统地下降。C项,习惯误差是指由于被试在长序列中有继续作同一种判断的倾向所引起的误差。
5.下列选项中,属于准实验设计的是( )。[统考2014研]
A.匹配组设计
B.被试间设计
C.被试内设计
D.交叉滞后组相关设计
【答案】D
【解析】准实验设计指未对自变量实施充分控制,但使用真正实验的某些方法搜集、整理以及统计分析数据的研究方法,交叉滞后组相关设计属于准实验设计。B项,被试间设计是指要求每个被试(组)只接受一个自变量水平的处理,对另一被试(组)进行另一种自变量水平处理的情况。C项,被试内设计是指每一个被试都接受自变量的所有水平处理的情况。
根据下列材料,回答6~8题。
为考察词的类型(靶子词、非靶子词)以及辨别条件(高辨别、低辨别)对双耳追随效果的影响,研究者将60名被试随机分为两组,每组30名,一组既接受靶子词-高辨别条件的处理,也接受靶子词-低辨别条件的处理;另一组既接受非靶子词-高辨别条件的处理,也接受非靶子词-低辨别条件的处理。
6.该实验设计是( )。[统考2013研]
A.被试间设计
B.被试内设计
C.混合设计
D.回归间断点设计
【答案】C
【解析】实验中两组不同被试接受两种类型的词(靶子词和非靶子词)的处理,是被试间设计(组间设计);所有被试接受两种不同辨别条件(高、低水平)的处理,属于被试内设计(组内设计)。在案例实验中既用组内设计又用组间设计叫做混合设计。
7.该实验中的辨别条件属于( )。[统考2013研]
A.被试间变量
B.被试内变量
C.额外变量
D.无关变量
【答案】B
【解析】实验中所有被试都接受两种不同辨别条件(高、低水平)的处理,属于被试内变量。
8.该实验存在的交互作用是( )。[统考2013研]
A.词的类型×辨别条件
B.靶子词×非靶子词
C.高辨别条件×低辨别条件
D.词的类型×辨别条件×追随效应
【答案】A
【解析】交互作用指的是两个因素在对方的不同水平上呈现出的效应存在差异,本实验研究为词的类型×辨别条件。
9.在实验研究中,排除法可用来控制额外变量,但也可能导致研究效度的降低。它可能降低的效度是( )。[统考2013研]
A.内部效度
B.外部效度
C.构思效度
D.统计结论效度
【答案】B
【解析】外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。而实验情景的过分人工化会使实验结果难以推广到其他现实情境中。
10.考察7、8、9岁三个年龄但女生对4种不同材料学习效果,其实验处理有( )。[统考2012研]
A.3种
B.4种
C.7种
D.12种
【答案】D
【解析】实验处理的自变量是年龄与材料,其中年龄为被试间变量,共3个水平,为7岁、8岁、9岁;材料为被试内变量,共4个水平。所以实验处理为3(三个年龄)x4(四种不同材料)=12种。
11.当实验出现了“霍桑效应”时,为了改进实验,后续研究应采取( )。[统考2012研]
A.双盲法
B.消除法
C.平衡法
D.对抗法
【答案】A
【解析】霍桑效应是指当被观察者知道自己成为被观察对象而改变行为倾向的反应。在心理学实验中,有效消除主试被试间不恰当的相互作用,保证实验内部效度的通用手段是双盲实验法。
12.一个实验有3组被试,方差分析的组内自由度为27,则该实验的被试总数为( )。[统考2011研]
A.24
B.28
C.30
D.81
【答案】C
【解析】根据已知条件,方差分析中,组别 k=3,组内自由度df=k(n-1)=3*(n-1)=27,小组人数n=10,总人数N=3*10=30
13.在实验研究中,衡量自变量和因变量之间关系明确程度的指标是( )。[统考2009研]
A.统计结论效度
B.外部效度
C.构思效度
D.内部效度
【答案】D
【解析】内部效度是指因变量确实是由自变量所引起的,而不是由其他因素所导致的。是衡量自变量和因变量之间关系明确程度的指标。实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度。统计结论效度是对数据分析处理程序的效度检验,构思效度是指心理测验对某一理论概念或特质测量的程度。
14.在探讨人类对不同语义范畴类别(动物、工具)、不同危险性概念(高危险、低危险)进行加工是否存在差异的一项研究中,其实验设计应是( )。[统考2009研]
A.二因素设计
B.四因素设计
C.二水平设计
D.四水平设计
【答案】A
【解析】该研究设计中有两个自变量(语义范畴类别和危险性概念),因此属于二因素的实验设计。
根据下表所示的实验设计方案(A、B为两个自变量,S为被试),回答15~17题。
15.这种设计是( )。[统考2009研]
A.ABBA设计
B.被试间设计
C.被试内设计
D.混合设计
【答案】D
【解析】该设计中不同的被试分别接受A因素的两个水平的处理,属于被试间设计,而每个被试都接受B因素三个水平的处理,属于被试内设计,因此该设计方案是混合设计。
16.该实验设计方案中的实验处理数为( )。[统考2009研]
A.3
B.4
C.5
D.6
【答案】D
【解析】A因素有两个水平,B因素有三个水平,结合起来组成6个实验处理。
17.若该设计的交互作用显著,则应进一步做的统计分析为( )。[统考2009研]
A.主效应检验
B.相关分析
C.简单主效应检验
D.回归分析
【答案】C
【解析】在多因素的方差分析统计中,如果交互作用显著,则需要进一步进行简单效应分析。
18.在一项研究情绪的实验中,要求A组被试在前后两次情绪测试之间观看恐怖电影,要求B组被试在前后两次情绪测试之间休息,则A组被试通常被看做是( )。[统考2008研]
A.后测控制组设计的控制组
B.后测控制组设计的实验组
C.前测—后测控制组设计的实验组
D.前测—后测控制组设计的控制组
【答案】C
【解析】这一实验是考察观看恐怖电影对个体情绪的影响,A组为实验组,B组为控制组。A组、B组均进行了两次情绪测验,因此,属于前测—后测控制组设计。这种实验设计中,实验组在接受实验处理前接受了一次前测,为分析实验处理的效应,提供了基线水平,同时设立了不接受实验处理的控制组,一定程度上控制了历史、成熟和统计回归等无关因素。
19.在一个3×3的实验设计中,存在的交互作用有( )。[统考2008研]
A.1个
B.3个
C.6个
D.9个
【答案】A
【解析】3×3实验设计表示实验中共有两个因素,每个因素有三个水平,共有9种实验处理,在多因素实验中,交互作用的个数=,其中n为实验所包含的因素数,因此,这个实验设计中存在的交互作用为=1个。
根据下述材料,回答8~10题。
国外某一实验探讨了青年与老年被试阅读自然科学类与社会科学类文章的阅读速度是否存在差异,结果表明:阅读速度受材料类型和年龄因素的影响,青年被试阅读自然科学类文章的速度较快,老年被试阅读社会科学类文章的速度较快。
20.该实验设计是一个( )。[统考2008研]
A.二因素设计
B.四因素设计
C.二水平设计
D.四水平设计
【答案】A
【解析】这个实验设计中,共包含两个自变量:年龄、材料类型,因此,属于二因素设计。
21.如采用被试内设计,最容易产生的效应是( )。[统考2008研]
A.霍桑效应
B.实验者效应
C.练习效应
D.安慰剂效应
【答案】C
【解析】被试内设计的特点是每一个被试都接受所有的实验处理,因此,最容易产生练习效应。
22.能够推断出“青年被试阅读自然科学类文章的速度较快,老年被试阅读社会科学类文章的速度较快”这一结论的统计依据是( )。[统考2008研]
A.材料类型和年龄的主效应均显著
B.材料类型和年龄的交互作用显著
C.材料类型和年龄的交互作用不显著
D.材料类型、年龄和阅读速度的交互作用显著
【答案】B
【解析】“青年被试阅读自然科学类文章的速度较快,老年被试阅读社会科学类文章的速度较快”,表明材料类型和年龄的交互作用显著,年龄对阅读速度的影响依赖于材料类型。
23.在一个2×2的完全随机设计中,若每种处理使用6名被试,整个实验设计需使用的被试数是( )。[统考2007研]
A.6
B.12
C.18
D.24
【答案】D
【解析】完全随机设计指的是每一个被试只参与一种实验处理。本题为2×2的完全随机设计,其实验处理有4个,每种处理需要6名被试,因此整个实验设计所需被试为24名。故本题的正确答案是D。
24.在2×3的实验设计中,研究的因素有( )。[统考2007研]
A.2个
B.3个
C.5个
D.6个
【答案】A
【解析】2×3代表的是本实验设计中有两个因素,其中第一个因素有两个水平,第二个因素有3个水平,整个实验有6种实验处理。故本题的正确答案是A。
25.如果不同的实验条件之间有相互干扰,最好采用( )。
A.组内设计
B.组间设计
C.拉丁方设计
D.混合设计
【答案】B
【解析】组间设计的特点是每一个被试只接受自变量的一个水平,因此,不会受到不同实验条件之间的相互干扰。而组内设计由于每一个被试接受自变量的所有水平,因此,会受到不同实验条件之间的相互干扰。
26.随着时间的流逝,被试内部结构发生改变,而影响了实验结果的真实性。这是指( )。
A.历史
B.选择
C.成熟
D.亡失
【答案】C
【解析】随着时间流逝,被试内部结构发生的变化属于成熟因素对实验结果的影响。选择指由于被试的选择的偏差所导致的对实验结果的影响,历史是指在实验过程中,与实验变量同时发生的事件对实验结果的影响。亡失是指在较长时间的实验周期中,由于被试退出实验或死亡对实验结果造成的影响,在发展心理学的纵向研究中经常发生被试的亡失。
二、多项选择题
1.所罗门四组设计的特点有( )。[统考2012研]
A.可检验前测验处理的效应
B.将“有无前测程序”这一变量引入实验设计中
C.可采用被试内设计的方差分析检验所有主效应
D.可检验“前—后测效应”与“实验处理”之间是否有交互作用
【答案】ABD
【解析】所罗门四组实验设计也叫“重叠实验设计”,是把后测设计和前测后测设计结合起来的一种实验设计,分别有两个实验组和两个控制组。除了具有单因素完全随机后测设计、单因素完全随机前测后测设计的优点外,所罗门四组实验设计对实验处理的效果进行了两次检验,既可以确认实验处理的效果,还可以检验测验与实验处理的交互作用。
2.平衡技术是控制额外变量的方法之一。常用的平衡技术有( )。[统考2008研]
A.匹配法
B.拉丁方设计
C.双盲法
D.ABBA法
【答案】BD
3.多自变量实验是指在一个实验中包含两个或两个以上的自变量的实验,它之所以被广泛采用,是因为它具有哪些优点( )。
A.效率高
B.实验控制较好
C.实验操作更简易
D.可以获得交互作用
【答案】AD
4.评价实验设计的标准是( )。
A.能够恰当地解决所欲解决的问题
B.恰当地控制实验中的无关变量
C.使实验结果有很高的可靠性(又称效度)
D.实验所用的仪器先进
【答案】ABC
5.在大多数实验室实验中,都会将灯光、噪音等作为( )。
A.自变量
B.因变量
C.额外变量
D.控制变量
【答案】CD
【解析】在大多数实验室实验中,灯光、噪音、温度等环境变量,通常作为控制变量和额外变量在实验中保持恒定。
6.多因素设计的主要特点是( )。
A.可以观察因素之间的相互作用
B.揭示不同因素之间的内在联系
C.获得更生态化的实验结果
D.实验设计与实施相对复杂
【答案】ABCD
三、简答题
1.简述心理实验过程的主要流程。[统考2014研]
答:心理实验过程的流程主要有:
(1)课题选择与文献查阅;
(2)提出问题与研究假设;
(3)实验设计与实施;
(4)数据处理与统计分析;
(5)研究报告的撰写。
2.某研究者假设:海马与复杂思维加工有关,与简单思维加工无关。该研究者随机选出20只白鼠平均分成两组,切除它们的海马,让第一组学习简单迷宫,第二组学习复杂迷宫。第一组经过10次学习就出现完全正确的情况,第二组在学习30次后才出现完全正确的情况。研究者据此认为最初的假设成立。请找出该设计中存在的问题,并完善原有的实验设计。[统考2007研]
答:(1)该设计中存在问题。任何白鼠学习复杂迷宫所需要的次数都要比学习简单迷宫多,实验结果可能与是否切除海马无关,用不切除海马的白鼠为被试可能会得到相同的结果。原设计使用了两个独立变量:任务难度和有、无海马,但只改变了其中—个独立变量,只说明了任务难度对学习的影响。要研究海马对思维加工的影响,应将海马体情况作为自变量,包括海马体完好和切除两个水平。
(2)完善的方案。加入海马完整的白鼠作为控制组,成为2×2实验设计:一个因素是海马情况,包括完好和切除两个水平,另一因素是迷宫的难度,包括简单和复杂两个水平。如下表:
研究海马情况和任务难度的交互作用,以及海马因素在简单任务和复杂任务两个水平上的单纯主效应。如果海马单纯主效应在简单任务水平上不显著而在复杂任务水平上显著,则能说明海马与复杂思维加工有关,与简单思维加工无关。
3.在准实验研究中可以得到因果关系的结论吗?为什么?举例说明。
答:(1)在准实验研究中不能得到因果关系的结论。
(2)在准实验研究中不能得到因果关系结论的原因。
①准实验设计中,只能选择某个特征(自变量)不同的被试,然后将这些在该自变量不同水平的被试行为加以比较。典型的准实验常用被试变量作为自变量,因为对于大多数天生的被试变量(年龄、性别、种族、种群)、社会引起的被试属性(社会阶层、宗教或居住区)、疾病以及与疾病有关的被试因素(肢体残缺、智力残疾、脑外伤、灾难后果)而言,只能选择而不是改变。
②但是,只是选择了在这个被试变量上有差异的被试,很难保证他们在其他相关变量上是相等的。即准实验中实验者的自由度是比较小的,对额外变量的控制也是较弱的。这使得被试变量的效用会和无法排除的额外变量的效用相混淆。因此,通过准实验得到的结果便不能像真正的实验结果那样可以安全地、毫无闪失地归因于自变量,而所得出的只能是自变量和结果变量之间的相关。
因此,在准实验研究中,可以认为变量之间是相关的,但不能认为一个变量的变化导致或引起了另一变量的变化。即准实验本质上是一种相关研究。严密控制、逻辑精巧的实验研究是获得因果关系的惟一有效途径。
(3)在教育改革过程中对新教材、新教法的试用过程,以及在医学的疗效评估中,经常使用的不等组前后测设计就是典型的准实验设计。举例如下:
①例如,研究者想研究不同的教材处理方法对学生学习成绩的影响。实验前,选择的教学班是两个现成班级,不可能因为实验而将两个班拆散后再随机分组,所以研究者只能随机将其中一个班作为实验组,另一个班作为控制组。依照准实验设计的模式,前测成绩是两个班(实验组和控制组)的小学升入初中的考试成绩和他们第一学期的期末考试成绩,这两个成绩作为两个班开始比较的基础。实验组实行的处理是对教材逻辑顺序的调整和增加教学过程的启发性,控制组使用传统的教学内容编排及教法。后测成绩来源于对两班学生实施的同一测验的测验分数。这就构成了一个不等组前测后测设计的准实验研究。
②再例如,某医疗研究机构研制了一种治疗儿童多动症的药物,为了试验此种药物是否真的有效,研究人员筛选了20名多动症儿童参加试验。为了试验的实施,他们编制了甲、乙两套学习材料,这两套材料经检验在难度等方面相当,以分别用于前测和后测。为了更可靠地进行比较,他们选取了年龄相近的某个年级一个班的学生(30人)作为对照组。实验分三个阶段进行:第一阶段是实验组和控制组均使用甲套材料进行前测,即均在同样长的时间里学习材料甲,然后检测学习成绩;第二阶段,多动症儿童接受药物治疗,而控制组不接受;第三阶段是两个组儿童各自都学习材料乙并进行学习效果的测试,这是后测。这也是一个不等组前后测设计的准实验研究。
从以上两个例子可以看出,在准实验设计中,被试不是被随机分配到各个实验条件中的,所以在控制个体差异产生的无关变量上,没有实验设计严格,可能会产生选择与成熟的交互作用或前后测的交互作用等;因而准实验研究不能得出因果关系的结论。
四、分析论述题
1.人们发现,大脑两半球对情绪性信息的加工是不对称的,在脑功能指标上存在着偏侧化现象,有两种理论对此加以解释:半球优势假说认为,只有右半球负责对情绪的加工;效价假说认为,不同效价的情绪是由不同的大脑半球进行加工的,右半球主要加工消极情绪,左半球主要加工积极情绪。
(1)请设计一个混合实验检验这两种假说,并简要说明需要控制哪些主要额外变量。
(2)什么样的实验结果支持半球优势假设说?
(3)什么样的实验结果支持效价假说?[统考2013研]
答:(1)被试选取:正常人被试,在利手性,性别,年龄,教育程度等方面匹配。
实验材料:情绪图片,(情绪效价分别为正性和负性,以及中性刺激作为填充材料。每种类型的图片数量相同)。
实验程序:将被试分为两组,其中一组被试观看负性情绪刺激,另外一组被试观看正性情绪刺激。同时进行fMRI扫描。
实验设计:自变量为:大脑半球(左半球,右半球)×刺激类型(正效价,负效价)。
因变量为:被试的左右半脑的激活情况。
需要控制的额外变量:
①被试的性别、左右利手性。两种条件下被试的男女人数相同,并且全部为右手利。
②被试的年龄。可以将年龄作为一个协变量,通过协方差分析的方法排除年龄的影响。
③被试的疲劳和厌倦等情绪。在实验刺激中插入部分中性刺激,采用随机化的方法呈现材料刺激。
数据分析:获得被试在正性刺激条件和负性刺激条件下的左右半球激活程度(中性刺激条件下的数据不进入数据分析)。然后进行两因素混合设计方差分析。
(2)如果对于两组被试,右半球的激活都显著高于左半球的激活,说明无论情绪刺激的效果如何,都是主要由右半球负责加工,这就支持了半球优势假说。
(3)如果对于负性情绪组,右半球的激活显著高于左半球,对于正性情绪组,左半球的激活显著高于右半球,说明不同效价的情绪是由不同的大脑半球分别进行加工的。该结果就支持了效价假说。
2.请阅读下列两段材料,回答后面的问题:
研究一:为研究家庭经济环境对儿童语言发展的影响,研究者随机选择了某市家庭经济收入高、低不同的两组儿童各50名,在控制了除经济收入外的其他重要的额外变量后,测量了这两组儿童分别在1岁和2岁时的语言发展水平。结果发现:两组儿童在1岁时不存在语言发展上的差异,但在2岁时差异显著,表现为来自高收入家庭的儿童比来自低收入家庭的儿童拥有明显的语言优势。据此结果,该研究推论,良好的家庭经济环境会促进儿童语言的发展。
研究二:在某些国家或地区,呈现伪证是警察审问嫌疑人获取口供的常用方法之一。为了证明其可靠性,研究者设计了一个2(高、低易感性)x2(有、无目击者)的完全随机实验。其中,易感性“高、低”是指被试分别以快、慢两种速度输入字母,目击者“有、无”是指主试r4伙报告“看见”或“没看见”被试是否敲击了“空格”键。因变量指标是被试顺从、内化和虚构的人数比例。“顺从”是指被迫承认敲击了“空格”键,“内化”是向别人叙述自己敲击了“空格”键,“虚构”是指向主试承认自己敲击了“空格”键。结果发现,被试有69%表现出顺从,28%表现出内化,9%表现出虚构,经检验差异显著。尤其是在高易感性和有目击者条件下,被试最有可能表现出顺从和虚构。这表明,呈现伪证能够使人们更易接受被指控的结果。该研究据此推论,警察审问时通过呈现伪证引出的供词并不可靠。
(1)这两项研究各自存在哪些不足?请说明理由,并分别给出改进的建议。
(2)试根据研究评价标准,分析这两项研究所存在问题的性质,并阐述它们之间的关系。[统考2012研]
答:(1)两项研究的不足、理由及改进建议:
①第一项研究的问题是年龄自变量变化范围过窄,选取的被试变量过于单一,只有两组被试即研究一岁儿童和两岁儿童并进行比较,代表性不够,不能揭示儿童语言发展是否与环境有关,其结论不能推广。因为儿童语言是处于不断发展之中,本研究只选取了1岁和2岁这两个阅读早期的年龄段,缺少年龄更大的不同家庭经济环境儿童的数据支持,两组儿童在年龄段上的差异并不表明在语言发展的其他年龄段也存在差异。后续研究可以进行追踪或者添加更多年龄段儿童的数据,如进一步测试这两组儿童在3、4、5、6岁年龄段(或更高年龄段)的语言发展水平,从而进行研究比较,得出更具说服力的结论。
②第二项研究的问题是研究结论外推的有效性。实验中的被试产生的是对无意识疏忽性行为的内化,并不能确认他们会对真实审问情境中的明确犯罪意图也产生内化。需要在接近真实的审问情境中检验被试对明确的犯罪意图指责产生内化的可能性。
(2)两项研究所存在的问题的性质及关系:
①第一项研究的问题属于研究的内部效度问题,指实验中的自变量与因变量之间因果关系的明确程度,研究一出现选择的交互作用问题(或者不同年龄段的成熟与语言测验之间的交互作用问题)。第二项研究属于研究的外部效度问题,表明生态学效度存在问题,指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。
②内部效度是外部效度的前提,没有好的内部效度,也就谈不上外部效度。但是,内部效度高并不能保证外部效度一定高。
3.表1和表2、表3和表4是针对同一问题采用两种不同的实验设计所获得的模拟实验研究结果。请据此回答下列问题:
(1)分别指出这两种实验各自属于何种设计类型,每种设计各自使用了多少被试。
(2)针对研究问题,根据实验设计一的统计分析结果,能得出什么结论?实验设计二与实验设计一的结论是否相同?如果不同,能得出什么结论?
(3)这两种设计中哪一种更适宜考察本研究的问题?请具体说明理由。[统考2008研]
实验设计一
表1 不同教学方法下不同类型学生的学习成绩
表2 方差分析结果
实验设计二
表3 不同教学方法下不同类型学生的学习成绩
表4 方差分析结果
答:(1)实验设计一为2×2被试间设计,被试为24人。
实验设计二为2×2混合设计,其中,学生类型为被试间变量,教学方法为被试内变量。被试为12人。
(2)根据实验设计一的结果,能得出如下结论:
①教学方法的主效应显著,启发式教学方法的成绩显著高于讲授式;
②学生类型的主效应不显著;
③教学方法和学生类型之间的交互作用显著,即教学方法对不同类型学生的学习成绩产生了不同的影响;与讲授式教学方法相比,启发式教学方法对学困生成绩的提高作用更大。
实验设计二与实验设计一的结论相同。
(3)比较说明
①比较而言,被试间设计的方案能更好地回答研究问题;
②虽然混合设计所需的被试量较少,且混合设计将教学方法作为被试内变量,能更好地控制来自不同个体间的差异,但当实验过程中容易产生累积效应或练习效应时,则被试内实验设计无法适用。本实验如果将教学方法作为被试内变量则会产生累积效应或练习效应,因此,包含被试内设计在内的混合设计不能回答该研究所探讨的问题,选择被试间设计更佳。
4.某研发机构开发了一套适合于5岁幼儿阅读能力训练的游戏产品,欲通过比较该产品使用三个月前后幼儿阅读能力的变化,以确定其有效性。请针对该目的提出具体实验设计方案,说明理由;并对预期的实验数据给出具体统计分析方法。[统考2007研]
答:根据题意,考虑到5岁儿童的阅读能力及其发展速度有一定的个体差异,而且在实验中,往往只能做到随机分配被试,很难做到随机取样,同时考虑到实验的目的主要是考察使用游戏产品前后儿童阅读能力的变化,所以在实验设计中使用前后测设计。前测的练习效应和成熟等影响可以通过设计控制组进行平衡。
(1)具体设计方法
①第一种实验设计方案。采用随机实验组控制组前测后测设计。该设计的自变量为是否接受游戏产品训练,因变量是幼儿的阅读能力,额外变量包括被试选取、历史成熟、实验组控制组学习内容是否相同等。由题意,通过前测可以获得所抽取样本的最初水平,再与后测结果进行比较,以分析实验处理的效应。同时,为了控制历史、成熟、测验等额外变量,增加了控制组。为了降低实验组和控制组被试之间的选择偏差,采取了随机分派被试的方法。
②第二种实验设计方案。同样采取前测后测方法,只是分配被试的方法不同。除了随机分派之外,还可以利用匹配法进行分配被试。因变量、自变量、额外变量同上。前测后测可以控制较有效的控制历史、成熟的因素,匹配的方法选择被试也较有效的控制了被试选取中产生的误差。
(2)实验方法的选择原理
真实验设计的本质特征在于对影响内部效度的无关变量采取严格的控制并有效地操纵研究变量。实验设计中综合采取随机取样、前测和控制组等手段。
①随机分配被试是保证实验组和控制祖被试特征相同的有效手段,因为它排除了被试取样偏差导致的系统误差。
②实验设计中还常采取匹配方法,即将在各个与实验相关的因素上相近或相同的被试匹配成对,随机分配到实验组和控制组。这种方法在一定程度上保证了两组被试的相等性。但实际上配对的因素的数量是有限的,不可能保证被试的所有相关因素都相同,而且这种方法比较烦琐,因而不如随机取样方法运用得广泛。
③在实验程序安排中,前测和控制组用于消除或平衡无关变量的干扰。实际上由于采用随机取样,使得前测的意义有所降低,因为前测也可能引起一定的练习效应。一般情况下,如果采用随机原则选取和分配被试,是否需要前测要视具体实验而定。
(3)具体统计分析方法
①检验
统计思路:
-=表示接受游戏产品训练的实验组前后阅读能力变化;
-=代表未接受产品训练的控制组或者匹配组前后阅读能力的变化;
-就表示接受游戏产品训练引起的阅读能力变化即产品的有效性。
具体统计检验:
分别进行实验组前、后测(与)相关样本检验,控制组或匹配组前、后测(与)相关样本检验,后测的实验组、控制组(与)独立样本t检验,或者后测的实验组、匹配组(与)相关样本检验。
t检验公式为(和分别代表相比较的两组的平均数)
为两样本平均数差数分布的标准误,相关样本和独立样本的计算方法不同。由于研究中,两总体都是正态分布,两总体方差都未知,当通过随机分配被试时,的计算公式为:,代表实验组的方差,代表控制组的方差。当通过匹配方法分派被试时,公式为:其中,
为实验组与匹配组中每一项之间的差异,为差异的平均数。
当前测与没有差异时,可直接比较后测与,也可以比较与,如果二者有差异则代表产品有效。若与有差异时,只能进行与的比较,如果二者有差异则代表产品是有效的。
②方差分析
检验的这种思路面临很多争论。比较一致的是采用协方差分析或重复测量方差分析。
统计思路:
协方差分析又称共变数分析,是将回归分析与方差分析结合起来使用的一种分析方法。在这种分析中,先将前测成绩作为协变量,建立因变量随自变量变化的回归方程,利用回归方程把因变量的变化中受前测成绩的影响扣除掉,从而能够较合理地比较在实验组和控制组下,经过回归分析手段修正以后的因变量的总体均数之间是否有显著性差异,这就是协方差分析的基本思想。
重复测量方差分析是把前后测作为一个组内变量,即重复测量,包括前测和后测,组别作为组间变量,包括实验组和控制组。方差分析的基本思路就是把各样本得到的原始观察值的总差异分解成组间差异和组内差异两部分,计算它们的相对大小:组间差异与组内差异的比值越大,说明各组平均数的差异就越明显。在计算中,以检验来推断多个平均数差异的显著性。
方差分析公式及方差分析表:
协方差分析公式:
其中是指通过建立回归方程将前测的影响扣除后各组成绩的均方。
对协方差分析的预测结果的解释:
如果协方差分析结果发现组别差异显著,即在控制了前测成绩的影响后,实验组的后测成绩显著好于控制组或匹配组,那么就表明该游戏产品对5岁儿童阅读能力的提高作用显著。
重复测量的方差分析公式和方差分析表:
公式如下:
对方差分析的预期结果做出解释:如果重复测量的方差分析结果发现组别主效应显著,实验组的成绩好于控制组或匹配组;测量与组别交互作用显著,通过交互作用图及分析发现控制组或匹配组的前后测成绩变化不大,而实验组前后测成绩变化幅度大,差异显著。那么结果就表明该游戏产品对5岁儿童的阅读能力的提高作用显著。