第3章 阅读发展的轨迹——汉语儿童汉字识别与口语词汇发展研究
Trajectories of Reading Development: A Follow-up Study of Chinese Children
[中国]周雪莲(Xuelian Zhou)[1]
[中国]李虹(Hong Li)[2]
[中国]德秀齐(Xiuqi De)[3]
本研究对180名孩子从一年级追踪到三年级,共施测4次,考察了儿童汉字命名和口语词汇的发展轨迹差异模式。研究发现,就汉字命名能力而言,传统起点分组和混合增长模型均支持补偿模式,传统起点分组与混合增长模型相比存在分组不稳定的问题;口语词汇发展轨迹呈现二次项增长模式,增长速度逐渐变缓,传统起点分组支持先补偿后稳定模式,潜变量增长模型支持稳定模式。本研究可以为低年级段的阅读教学提供一定的启示。
阅读焦点
·本章系统介绍了汉语低年级儿童汉字识别和口语词汇发展的个体差异稳定性和发展轨迹,并系统比较了传统起点分组方法与混合增长模型及潜变量增长模型的结果差异。
关键词
发展轨迹,汉语儿童,汉字识别,口语词汇
阅读发展的轨迹
学会阅读是一个长期的过程,提高和发展是学习的核心概念(Boscardin,Muthén,Francis & Baker,2008)。许多国内外的横断和追踪研究均表明,小学阶段是孩子阅读能力迅速发展的关键时期(Xue,Shu,Li,Li & Tian,2013;Yeung et al.,2012)。尽管大部分孩子的阅读能力都会随着教育年限的增加而逐步提高,但并非所有孩子都遵循相同的发展轨迹。相反,越来越多的研究发现,不同个体阅读能力的发展轨迹存在巨大差异,其中3种最有影响力的阅读发展轨迹差异模式分别为:马太效应模型、补偿模型和差异稳定模型(Pfost,Hattie,Dörfler & Artelt,2014)。
简单来说,马太效应是指好的变得更好、差的变得更差,如图3-1模式A。自从相关论文发表以来,教育家们广泛认为阅读领域也存在马太效应(Stanovich,1986)。斯坦诺维奇提出,起初阅读能力较低的儿童,阅读动机不强,阅读量也更少,导致词汇量发展缓慢,而词汇量发展的缓慢反过来阻碍阅读理解能力的提高,导致阅读动机进一步降低,阅读量更少,而较少的阅读训练又会导致词汇量和阅读理解能力的落后。在这个恶性循环中,消极阅读体验导致了一个向下盘旋式的不断失败。相反,起初成绩好的孩子则形成良性循环,导致一个向上盘旋的发展成功(Stanovich,1986)。此后,也有研究者把这种个体间差异不断扩大的现象称为差异扩大模型(fan-spread pattern)(Cook & Campbell,1979)或累积阅读轨迹(a cumulative reading trajectory)(Leppänen,Niemi,Aunola & Nurmi,2004)。
图3-1 三种阅读发展轨迹差异模式
注:该图引自Pfost等人(2014)的研究,模式A表示马太效应,模式B表示补偿模式,模式C表示差异稳定模式。
然而,自马太效应提出之后,实证研究在试图验证马太效应的过程中越来越多地发现了相反的结果,由此研究者提出了一种相反的观点:补偿模式或差异缩小模式(Leppanen et al.,2004;Phillips,Norris,Osmond & Maynard,2002),如图3-1模式B所示。根据这种观点,那些起初技能水平比较低的孩子可能追赶上同伴,而那些起初阅读技能较好的孩子在阅读技能达到一定水平时会表现出较慢的发展速度,因而个体间的阅读成绩差异随时间流逝而不断缩小。
此外,在马太效应和补偿模式之外,还有研究者报告了个体差异发展的第三种模式——差异稳定模式(Pfost et al.,2014)。该模式假设阅读成绩起始点不同的孩子始终保持稳定的成绩差异,如图3-1模式C所示。在这种情况下,学生之间的差异在发展过程中既没有扩大也没有减小。
从现有研究来看,这三种发展模式都得到了一些实证研究证据的支持,但是没有哪一种结论能够占据主导地位。导致这些观点分歧的原因众多,其中对阅读能力这一复杂技能的不同测量方法,以及统计方法的差异是研究者尤其需要关注的两个方面。
阅读技能的不同方面
阅读是一个复杂的认知加工过程,研究者在考察儿童的阅读能力发展水平时,涉及了词汇识别、假词解码、阅读理解、阅读流畅性等多个不同的侧面,而阅读技能不同方面的发展轨迹可能是不同的(Parrila et al.,2005;Pfost et al.,2014)。
根据帕里斯(Paris,2005)的观点,阅读技能可以分为高限制性技能(highly constrained skills)和低限制性技能(less constrained skills)两大类。其中,高限制性技能通常可以在相对较短的发展时期内被掌握,如字母知识、音位意识、书面概念等。因此,对于阅读成绩好的孩子,高限制性技能的增长空间是有限的,由此可以预期,当达到某一个发展时间点之后,成绩好的孩子的阅读能力发展速度趋向平坦,甚至稳定在一个相对成熟的水平,而那些起点较低的孩子或者说发展滞后的孩子,仍然有很大的发展空间,一直保持快速增长,最终也能掌握这种阅读技能,因此,高限制阅读技能的发展轨迹更有可能呈现补偿模式。
相对而言,限制较弱的技能,如词汇量、阅读理解等,通常在很长的时期内,甚至是个体一生中都处于不断发展之中。因此,低限制性技能为起点高的阅读者提供了很大的上升空间,起初成绩较好和较差的孩子都处于持续发展之中,甚至成绩好的孩子有可能由于各方面的优势而发展速度更快,从而使成绩好差孩子之间的差距一直存在,甚至不断扩大。因此,在低限制性技能的发展过程中,更有可能出现稳定模式或马太效应。
统计方法的影响
在验证三种发展模式时,关于不同的统计分析方法是否会导致研究结果不一致,曾引起研究者的广泛讨论。有研究者在同一研究中,采用不同的统计方法,对同一批孩子的同一种阅读技能进行了不同的分析,结果发现不同的分析方法并没有对结果产生重大影响(Baumert et al.,2012;Leppänen et al.,2004;Parrila et al.,2005),但也有研究者却报告并非如此(Bast & Reitsma,1997)。
在相关研究中,研究者多采用按照第一次或者某几次的测验成绩进行分组以考察不同组发展差异的方法。这种方法侧重于对组别与时间的交互作用的分析,通常首先依据儿童早期某次或某几次的阅读能力测验,将学生划分成起点不同的小组,然后进行追踪,通过方差分析探讨组别因素与时间因素是否存在交互作用,以此判断发展轨迹的差异模式。这种方法操作相对简单,对测验时间点的次数要求也不高,因此得到一些研究者的青睐。例如,有研究者(Kempe,Eriksson-Gustavsson & Samuelsson,2011)对瑞典儿童进行了从一年级到三年级的追踪研究,根据学前筛选测验和第一次测验成绩,从360名儿童中最终筛选出45名阅读落后高危儿童和89名控制组儿童,采用组别×时间的方差分析,结果发现在阅读理解、词汇测验上,两个组后来的差距变大了,出现了马太效应;而在假词解码有效性、真词解码有效性、拼写成绩中,两个组则出现了相同程度的增长,不支持马太效应或者补偿模式。
虽然这种方法逻辑清晰,操作简单,但是仅依据学生的初始成绩进行分组,并没有考虑到后期的发展变化,因此分组可能存在随时间变化不稳定的问题。此外,这种方法并不能模拟出儿童在整个时间段的发展轨迹。因此,还需要尝试更多的最新统计分析方法,如混合增长模型或者潜变量增长模型等。
汉语阅读发展轨迹差异的研究现状
尽管拼音文字中已有不少关于阅读发展轨迹的研究,但是由于汉字的形态特点、表音、表义方式都与拼音文字存在巨大差别,拼音语言中的研究成果并不能直接推论到汉语儿童中。因此,深入探讨汉语儿童阅读能力的发展轨迹,一方面有利于对汉语儿童阅读发展独特规律的科学把握,另一方面也有利于揭示语言发展的一般规律。
目前,汉语中通过长期追踪数据来探讨阅读发展轨迹的研究还很少,主要有对北京地区普通话儿童的追踪研究(e.g.,Lei et al.,2011;Song et al.,2014)和对香港地区广东话儿童的追踪研究(e.g.,Yeung,Ho,Chan & Chung,2014;Zhang et al.,2014)。上述研究对于我们深入了解汉语儿童的发展特点具有重要意义,但是有研究重点在于探讨幼儿到入学后一两年间的言语技能(词汇定义)或言语技能、阅读相关认知技能、阅读技能的发展轨迹(Lei et al.,2011;Song et al.,2014),且仅将后期一个时间点的解码准确性、解码流畅性、阅读理解成绩作为因变量来探讨其与前期相关技能发展轨迹的关系,主要关注的是阅读能力和口语能力发展水平的早期预测指标,而不是阅读能力个体差异的发展轨迹。追踪研究中主要采用前后两次测验的成绩百分比将孩子人为划分为不同发展组的传统分析方法,可能存在分组不稳定的问题(Yeung,Ho,Chan & Chung,2014;Zhang et al.,2014)。因此,本研究计划在采用传统起点分组比较方法的同时,尝试采用混合增长模型等更为复杂的统计分析方法,来深入探讨儿童阅读个体差异的发展轨迹。
汉字识别能力的发展轨迹研究
这项研究的研究对象为北京某小学一年级8个班的学生,共202名,其中男生101名,女生101名。由于孩子生病缺席以及转学等原因,最终用于研究一样本数量为180人,其中男生93人,女生87人。学生4次测试年龄分别为79.98月±3.58月,85.98月±3.58月,90.98月±3.58月,102.98月±3.58月,对应的年级分别为一年级上学期、一年级下学期、二年级上学期和三年级上学期。
汉字命名任务来自前人研究(Li et al.,2012),共150个汉字,由易到难排列,要求儿童依次读出汉字的正确读音,主试同时记录其反应。若儿童连续读错15个汉字,测验停止。儿童正确读出一个汉字得1分,读错得0分,累积得分计为总分。
分组及高、中、低三组儿童的发展水平
参照前人文献中所用方法(e.g.,Kempe et al.,2011;Protopapas et al.,2011;Yeung et al.,2012),依据一年级上学期的初始成绩,将学生的成绩从低到高排序,将孩子划分成低起点组(最低25%,46人)、中等起点组(中间50%,91人)、高起点组(最高25%,43人)。在此基础上,通过3(学生能力分组:高、中、低)×4(4个测试时间点)的方差分析来看不同组别与测验时间点是否存在交互作用。如果出现交互作用,且不同组间的差距随着年级升高而缩小,说明儿童的汉字命名能力发展轨迹可能存在补偿模式;如果出现交互作用,且不同组间的差距随年级升高而增大,则可能存在马太效应;如果没有出现交互作用,三组平行增长,则表明儿童汉字命名能力发展的个体间差异相对稳定。
为了考察高、中、低三组儿童在四次汉字命名测验中各自的发展情况,对三组儿童的四次测验成绩做了描述统计,结果见表3-1。
为了更形象地反映每组儿童的发展情况和内部差异,根据高、中、低三组儿童的四次成绩分别做了每一组内部每个儿童的发展轨迹图,见图3-2、图3-3、图3-4,其中每一条线代表了一个儿童历年的测验成绩。
从图3-2、图3-3、图3-4中可以看到,每个儿童的汉字命名成绩随年级增加而逐步提高。总体来看,图3-2中,低起点组内部儿童的发展轨迹异质性较大,而图3-4中的高起点组儿童内部发展轨迹较为一致。
表3-1 高、中、低起点组儿童的汉字命名成绩及差异比较
图3-2 低起点组所有儿童发展轨迹图
图3-3 中起点组所有儿童发展轨迹图
图3-4 高起点组所有儿童发展轨迹
3×4方差分析来看发展轨迹差异模式
为了考察高、中、低起点组儿童的汉字命名发展轨迹是否符合补偿模式、马太效应或者稳定模式,进行3(高、中、低起点三个组)×4(四次汉字命名测验成绩)混合设计的方差分析。结果发现,组别的主效应显著,F(2,177)=239.85,p<0.001;测验时间点的主效应显著,F(3,531)=1452.60,p<0.001;组别和测验时间点的交互作用也显著,F(6,531)=47.70,p<0.001,见图3-5。
图3-5 汉字识别成绩组别和测验时间点的交互作用
进一步的简单效应检验显示,在四个时间点上,高、中、低三组的差异均显著,F一年级上(2,177)=418.89,p<0.001,F一年级下(2,177)=169.16,p<0.001,F二年级上(2,177)=120.13,p<0.001,F三年级上(2,177)=44.94,p<0.001。多重比较显示,在四个时间点上,三组之间的两两差异均显著,所有p<0.001。
尽管三个组的组间差异在各个测验时间点上均差异显著,但四个测验时间点的简单效应分析得到的F值来看,从一年级上到三年级上,组间差异的F值是逐渐减小的,结合交互作用的结果可知,高、中、低三组儿童在汉字命名成绩上的差异随着年级的升高而缩小,符合补偿模型的预期。
分组稳定性分析
传统的按照起点分组的方法由于没有考虑到后期儿童发展速度的变化,可能存在分组不稳定的问题。为了考察本研究中所使用的传统分组方法的分组稳定性,我们采用树状图对学生的分组进行了系统分析。
树状图的做法如下,首先,依据一年级上学期汉字命名成绩将学生划分为低、中、高三个组,分别对应于得分最低的25%、中间的50%和得分最高的25%;然后,在随后的三次测验中,每次都根据学生的汉字命名成绩,按照完全相同的标准——最低的25%、中间的50%和最高的25%,再次将孩子归类,最终共得到27个可能的小组,如图3-6所示。
图3-6 树状图示意图
因为追踪时间点较多,学生归类复杂,我们分别对高、中、低起点组做了三个树状图分析,分别见图3-7、图3-8、图3-9,以期考察三组各自的分组稳定性。
从图3-7低起点组的树状图可以看出,一年级上学期时,处在最差
图3-7 低起点组的分组稳定性
25%的有46人,到了一年级下学期,该组中仍有32人处于最差的25%,11人变成了中间的50%,3人变成了最好25%的好生组。以此类推,到了三年级上学期时,历次测验四个时间点的成绩始终处在最差25%的持续差组只剩下了23人,仅占一年级上时低起点组人数的50%。
从图3-8中等起点组的树状图可以看出,一年级上学期时处在中间50%的有91人,到三年级上学期时,在历次四个时间点中一直处在中等50%的持续中等组只剩下45人,占原来人数的49.5%。
图3-8 中等起点组的分组稳定性
从图3-9高等起点组的树状图可以看出,一年级上学期处在最高25%的有43人,到三年级上学期时,在历次四个时间点中一直处在最高25%的持续好组还剩下25人,占原来分组人数的58.1%。
总的来说,按照起点分组的三个组的稳定性均不是很好,持续好、持续中等或者持续差的孩子仅占最初分组人数的一半左右。此外,从上述分析中还可以看到,低起点组和中等起点组的孩子后期波动比较大,而高起点组的孩子后期分组相对稳定。低起点的孩子后期发展个体差异较大,每次测验中都会极少数孩子(1~3个)成为最好的25%,而高起点组的孩子则从没有任何人在任何一次测验中落入最低的25%。
图3-9 高起点组的分组稳定性
传统起点分组与混合增长模型的分组结果比较
混合增长模型是目前追踪研究中使用较少的最新分析方法,其核心思想是在潜变量增长模型的基础上,同时考虑初始水平和历年的增长情况,将儿童的发展轨迹划分为不同的亚类型。我们采用混合增长模型,对学生的汉字命名发展轨迹亚类型进行了考察,通过尝试将学生划分为发展轨迹不同质的2个、3个、4个或5个不同组,比较不同分组数量以及不同拟合方式的优劣。
经过多次尝试,根据混合增长模型所得BIC和熵(Entropy)的值,我们最终确认分成三种类型的线性拟合结果最好,并得到了汉字命名发展轨迹的三种亚类型:第一类为低—快组,即初始成绩最低、发展速度最快的组,共77人,占总人数42.78%;第二组为中—中组,即初始成绩中等、发展速度中等的组,共68人,占总人数37.78%;第三组为高—慢组,即初始成绩最好、发展速度最慢的组,人数为35,占总人数19.44%。可以看出,这与传统起点分组方法的结果相似,三组之间的差异呈现缩小趋势,也支持汉字命名发展轨迹存在补偿模式。
为了比较传统分组方法和混合增长模型的异同和优劣,我们对这两种分组的结果进行了详细比较。
首先,我们系统整理了两种分组方法得到的个体重叠情况,并画出了示意图。其中,方块表示传统起点分组,高、中、低各43人、91人、46人,圆形表示混合增长模型的分组结果,面积大小与人数多少相对应。
其中,低—快组与高、中、低起点组的重叠情况,见图3-10。从中可以看出,低—快组的77人中有42人来自低起点组,其余35人来自中起点组,没有任何人来自高起点组。
图3-10 低—快组与不同起点组的重合情况
同样,我们整理出了中—中组与高、中、低起点组的重叠情况,见图3-11,可以看出中—中组(56)与低起点组(46)重合3人,与中起点组(91)重合56人,与高起点组(43)重合9人。
高—慢组与高、中、低起点组的重叠情况见图3-12,其中高—慢组(34)与低起点组(46)重合1人,与高起点组(43)重合34人,没有人来自中起点组。
图3-11 中—中组与不同起点组的重合情况
图3-12 高—慢组与不同起点组的重合情况
总的来说,低—快组与低起点组,中—中组与中起点组,高—慢组与高起点组重合比例最高,而低—快组没有人来自高起点组,而高—慢组只有一个人不是来自高起点组。二者最大的不同可能在于传统分组方法的中起点组中有35人在混合增长模型的分类中被分到了低—快组。
其次,为了进一步比较两种方法分组的稳定性,我们还考察了混合增长模型分组得到的低—快组、中—中组和高—慢组与树状分析中的持续好组、持续中等组、持续差组的重合情况,分别见图3-13、图3-14和图3-15。其中,方块代表持续快组、持续中等组、持续好组,分别代表在四次测验中均持续停留在最低25%、中间50%和最高25%的三组人,人数分别为23人、45人和25人,圆形代表混合增长模型分出的低—快组、中—中组和高—慢组,图中面积大小与人数多少相对应。
从图3-13可以看出,低—快组与持续差组重合人数23人,占持续差组总人数的100%。而在图3-10中,低—快组与低起点组重合人数占低起点组人数为91.30%,低—快组与代表稳定性的持续差组重合度更高。
图3-13 低—快组与持续好、中、差孩子的重合
从图3-14可以看出,中—中组与持续中等组重合人数33人,占持续中等组总人数的73.33%。而在图3-11中,中—中组与中等起点组重合人数仅占中等起点组的61.53%。
从图3-15可以看出,高—慢组与持续好组重合人数23人,占持续好组人数的92%。而在图3-12中,高—慢组与高起点组重合人数79.07%。高—慢组与代表稳定性的持续好组重合度更高。
图3-14 中—中组与持续好、中、差孩子的重合
图3-15 高—慢组与持续好、中、差孩子的重合
讨论
研究一首先采用传统起点分组方法探讨了汉字命名的发展轨迹,结果发现,在根据起点成绩将学生分组之后,在随后的多次测验中,高、中、低三组的差异持续存在,并且高、中、低三组的组别与时间存在交互作用,表现为组间差异随时间而缩小,显示出补偿模式。随后,在采用混合增长模型时,最优化的分组方式仍然是三类,分别命名为低—快、中—中、高—慢三个发展轨迹亚类型,也同样支持补偿模式,这一结果与前人在拼音文字中的研究一致(Aarnoutse & van Leeuwe,2000;Foster & Miller,2007;Rescorla & Rosenthal,2004;Parrila et al.,2005),报名汉字识别作为一种低限制性技能,在小学低年级阶段更符合补偿模式的假说,不支持马太效应。
需要特别注意的是,尽管组间的差异在变小,但是不同组儿童的差距一直持续存在,这意味着尽管不同儿童之间在汉字命名上的差距在逐步缩小,但初始成绩较差的儿童始终落后于初试成绩好的儿童。
此外,本研究对传统起点分组的稳定性进行了详细考察。树状图结果表明,根据起点成绩分组之后,持续差、中、好的儿童分别只占低、中、高起点组人数的一半甚至更少。而混合增长模型的分组结果在一定程度上与传统起点分组结果类似,都是分成三组,并且低—快组与低起点组重合人数最多,中—中组与中起点组重合最多,高—慢组与高起点组重合最多。进一步的比较发现,混合增长模型分组结果与代表分组稳定性的持续差、持续中和持续好组的重叠率更高。所有持续差组学生都被归入了低—快组,持续中等组中的73%学生都归入了中—中组,而92%的持续好组学生被归入了高—慢组。
口语词汇发展轨迹差异模式研究
该研究被试依然沿用之前的被试样本,测试采用词汇任务。
口语词汇任务主试口语呈现一个词,让儿童口头解释其含义(李虹,董琼,朱瑾,刘俊娉,伍新春,2009),主试逐字记录答案,再由经过训练的两名研究人员进行0、1、2评分。共32个项目,从易到难排列,连续5个词语得0分则停止测验。两位研究员对第一次测验中的所有32个项目进行了独立评分,评分者一致性为0.94。
分组及高、中、低三组儿童的发展水平
同研究一,我们首先依据一年级上学期儿童的初始成绩排序,将儿童划分成低起点组(最低25%)、中等起点组(中间50%)、高起点组(最高25%),在此基础上通过3(学生能力分组:高、中、低)×4(四个测试时间点)方差分析来看不同组与测验时间点是否出现交互作用,以此考察口语词汇发展轨迹差异模式。
为了考察高、中、低起点的三组儿童在口语词汇测验中各自的发展情况,对三组儿童的四次测验成绩做了描述统计,结果见表3-2。
表3-2 高、中、低起点组儿童岁的口语词汇成绩及差异比较
为了更形象地反映每组儿童的发展情况和内部差异,根据高、中、低起点三组儿童的四次成绩分别做了每一组儿童的发展轨迹图,见图3-16、图3-17、图3-18,其中每一条线代表了一个儿童历年的测验成绩。
从图3-16、图3-17、图3-18中可以看到,每个儿童的口语词汇成绩随年级增加而逐步提高。总体来看,图3-18中高起点组内部儿童的发展轨迹异质性较大。
图3-16 低起点组口语词汇发展图
图3-17 中等起点组口语词汇发展图
图3-18 高起点组口语词汇发展
3×4方差分析来看发展轨迹差异模式
为了考察高、中、低起点组儿童的口语词汇发展轨迹是否存在补偿模式、马太效应或者稳定模式,进行3(高、中、低起点三个组)×4(四次口语词汇测验成绩)混合设计的方差分析。结果发现,组间差异的主效应显著,F(2,177)=87.67,p<0.001;测验时间点的主效应显著,F(3,531)=168.44,p<0.001;组别和测验时间点的交互作用也显著,F(6,531)=13.38,p<0.001。见图3-19。
图3-19 口语词汇成绩组别和测验时间点的交互作用
进一步简单效应检验发现,在四个时间点上,高、中、低三组的差异均显著,F一年级上(2,177)=399.86,p<0.001,F一年级下(2,177)=21.77,p<0.001,F二年级上(2,177)=23.43,p<0.001,F三年级上(2,177)=17.46,p<0.001,多重比较显示,在四个时间点上,三组之间的两两差异均显著,所有p<0.001。
尽管三个组的组间差异在各个测验时间点上均差异显著,但四个测验时间点的简单效应分析得到的F值来看,从一年级上到一年级下,F值明显变小,而一年级下到三年级上,F值变化不明显。结合交互作用的分析结果可知,高、中、低起点三组儿童在口语词汇成绩上的两两差异一直显著,但是三组儿童在早期差距显著缩小,后期差距则相对稳定。因此儿童的口语词汇成绩发展轨迹差异呈现出先补偿后稳定模式。
分组稳定性分析
为了考察本研究中使用传统方法时是否存在分组不稳定的问题,我们采用树状图对学生的分组进行了系统分析,基本方法同研究一。
我们分别对高、中、低起点组做了相应的树状图,分别见图3-20、图3-21、图3-22,以期考察三组各自的分组稳定性。
从低起点组的树状图(图3-20)中可以看出,一年级上学期处在最低25%的43人,在历次测验中一直处在最低25%的持续差组只有11人,仅占一年级上时低起点组人数的25.58%。
图3-20 低起点组的分组稳定性
从中等起点组的树状图(图3-21)中可以看出,中起点组90人,到三年级上学期时,在历次四个时间点中一直处在中等50%的持续中等组只剩下15人,仅占原来人数的16.67%。
从高起点组的树状图(图3-22)中可以看出,在一年级上学期处在最高25%的有47人,到三年级上学期时,在历次四个时间点中一直处在最高25%的持续好组只剩下8人,仅占原来分组人数的17.02%。
图3-21 中等起点组的分组稳定性
图3-22 高起点组分组稳定性
总的来说,三个组的分组稳定性均不好,持续好、持续中等或者持续差的儿童均小于或等于原来人数的四分之一。此外,低起点组儿童有6人在后期成为最高的25%,而高起点组的儿童有4人后期落入最低的25%。
潜变量增长模型分析
我们采用混合增长模型,对学生口语词汇的发展轨迹的亚类型进行了考察,但模拟拟合欠佳,未找到理想的分组模式。于是,我们尝试采用潜变量增长模型考察了口语词汇的发展轨迹及其差异模式。
首先,我们采用线性增长模型模拟了口语词汇的发展轨迹,结果模型运行正常,但是模型拟合指数不好,χ2=13.29,df=5,p=0.02,CFI=0.958,TLI=0.950,RMSEA=0.10。接着加入二次项,采用二次项增长模型进行拟合,结果模型不正定,显示应限定线性增长参数(斜率)方差,故限定斜率方差为0,斜率与截距、二次项分别相关为0,限定后得到的二次项增长模型,结果模型拟合尚好,χ2=6.84,df=4,p=0.14,CFI=0.986,TLI=0.978,RMSEA=0.076。故最终采用限定斜率方差的二次项增长模型,具体各项参数见图3-23和表3-3。
图3-23 口语词汇二次项增长曲线模型
从图3-23和表3-3可以看出,口语词汇发展轨迹呈二次项增长曲线,儿童初始平均成绩为14.78,平均增长速度为3.04,增长加速度为-0.21,因此儿童的口语词汇是随着年级而逐渐增长的,但是增长速度逐渐变慢。由于斜率和截距相关为0,二次项和斜率相关不显著,因此在口语词汇中并没有发现马太效应或补偿模式,而是倾向于支持稳定模式。
表3-3 口语词汇二次项增长模型各项参数
注:α1-α2=模型所估计的潜变量平均值;Ψ11-Ψ12=潜变量的方差以及潜变量之间的协方差;θ1-θ4=口语词汇四次测验成绩观测值的残差。
讨论
本研究发现,采用传统起点分组方法,尽管高、中、低三组差异持续存在,但是高、中、低起点不同的组别与时间存在交互作用,组间差异随时间而缩小;更进一步的分析发现,从一年级上到一年级下,显示出补偿模式,而一年级下到三年级上,差异稳定。
树状图分析的结果显示,三个组的分组稳定性均不好,持续好、持续中等或者持续差的儿童均小于或等于原来人数的25.58%,这表明传统起点分组方法得到三个组存在不稳定的问题,并且这种不稳定性比汉字识别测验更大此外,潜变量增长模型拟合出二次项曲线增长模型,该模型显示儿童整体的口语词汇成绩随时间而增长,但是增长速度逐渐降低,并且发展轨迹差异模式的截距和斜率呈现出0相关,同时斜率差异限定为0,即儿童的增长速度保持一致,这表明口语词汇存在差异稳定模式。
总的来说,传统起点分组方法和潜变量增长模型均更支持差异稳定模式,相对而言,传统起点分组可以得到三个不同的组及其发展情况,但是存在分组不稳定的问题;而潜变量增长模型可以模拟出儿童整体发展轨迹,但只能从整体上判断出发展轨迹及其差异变化趋势,不能像混合增长模型那样根据发展轨迹对学生进行分组。
综合讨论
本研究对180名汉语儿童进行了长达三年共四次测验的追踪,通过两个研究,采用不同方法分别探讨了汉字命名和口语词汇的发展轨迹差异模式,结果总结如表3-4。
表3-4 两种阅读分技能的发展轨迹差异模式结果总结
从表3-4中可以看出,我们采用不同的方法所得结果总体一致,但不同方法之间各有优劣和特点。此外,不同变量所呈现的发展模式也是不同的。
不同统计方法差异比较
总的来说,同一变量中,采用不同方法得到的模式是较为一致的。在我们的研究中,分别采用传统起点分组方法和混合增长模型探讨汉字命名发展轨迹差异模式,结果均支持补偿模式。而在口语词汇分析中,传统起点分组方法支持先补偿后稳定的模式,而潜变量增长模型则支持稳定模式。因此,我们的研究结果表明,正如有些研究者所言,不同的方法并不会对结果带来重大影响(Baumert et al.,2012;Leppänen et al.,2004;Parrila et al.,2005 study 2)。
但是需要注意的是,相比较而言,传统起点分组方法存在分组不稳定的问题。树状图表明一年级时被分在最低、中间、最高的学生在三年中持续留在最低、中间、最高的人数仅占很小比例。尽管我们在研究一发现了补偿模式、在研究二中发现了稳定模式,但高、中、低三个组的差距始终是显著的,因此这种不稳定不能归结于儿童阅读能力个体差异发展本身的特点,而更有可能由于分组方法所致。
不仅如此,我们在研究一中还对传统起点分组和混合增长模型的分析做了深入的比较,结果发现,依据初始水平和增长速度划分亚类型的混合增长模型,分组人数与持续好、中、差人数重合更多,而与高、中、低起点组重合人数较少,这表明混合增长模型同时考虑到了初始成绩和增长速度,分组稳定,组内更为同质,组间更为异质,具有很大的优势。
此外,潜变量增长模型也很好地模拟出了儿童口语词汇的发展轨迹,不仅可以描述增长速度,还可以描述增长速度随时间的变化,在描述发展轨迹上也有一定的优越性。
需要说明的是,我们仅在汉字命名上实现了混合增长模型分析,发现了不同的亚类型,而对口语词汇的分析只用了潜变量增长模型,并没有划分出不同的亚类型。这可能一定程度上也说明,尽管混合增长模型相比其他方法具有很大优势,但是也有可能出现有些变量由于本身发展轨迹较为同质,并不适合采用这种方法的情况。
不同阅读分技能发展轨迹差异模式比较
依据简单阅读模型(simple view of reading,SVR)(Hoover & Gough,1990),阅读理解可以分为解码和言语理解两部分。本研究选用汉字识别作为准确性解码的指标,选用口语词汇作为言语理解的指标,分别探讨了小学低年级阶段两项重要的阅读分技能——汉字命名和口语词汇的发展轨迹差异模式。
总体而言,我们在解码能力上发现了补偿模式,而在口语词汇上发现了稳定模式。这符合帕里斯(Paris,2005)提出的高、低限制性技能的观点。儿童可以在较短的时间内掌握解码,因此解码能力,尤其是解码准确性属于高限制性技能,短期内所有儿童都可以学会,成绩好的儿童很快失去了提升空间,成绩差的儿童则很快跟上成绩好的儿童,因此越容易出现补偿模式。
而口语词汇与阅读理解,被认为是终其一生都在发展的技能,因此被认为是低限制性技能,成绩好的儿童一直有增长空间,同时成绩差的儿童短期内很难赶上,甚至出现差距扩大的现象,因此前人研究多在口语词汇中发现马太效应(Cain & Oakhill,2011;Kempe et al.,2011),本研究中则发现口语词汇出现差异稳定模式。有研究者(Protopapas et al.,2011)认为,广泛意义的马太效应可以分为三种,第一种是绝对马太效应,个体差异既体现在初始成绩(截距)上,也体现在增长速度(斜率)上;第二种和第三种则是相对马太效应,个体差异分别体现在初始成绩或增长速度上。可以看到,其中的第二种正是对应其他研究者所说的稳定模式,尽管差距没有扩大,但是初始成绩的差异是恒定存在的。
我们的研究还表明,尽管口语词汇成绩不断提高,但是提高的速度减缓。而且我们从描述统计可以看到,一年级上、一年级下、二年级上、三年级上的口语词汇成绩的平均分分别是14.62、17.90、19.78、23.64,三年级上的最高得分为40,而口语词汇的总分为64。整体来说,尽管儿童的提升空间还有很多,但是口语词汇成绩的提高是缓慢的。而在传统起点分组中,我们发现低起点组在一年级上到一年级下,成绩得到很大提高,而高起点组一上到一下,则几乎没有提高。这可能意味着口语词汇起点低的儿童从家庭环境进入到学校环境之后,得到了很大的提升;而高起点组由于早期已经掌握简单词汇,上学所带来的这方面的提高并不明显。一年级下以后,所有儿童的口语词汇缓慢增长,这可能由于一到三年级阶段主要是学会阅读阶段,学校和老师的教学重点放在识字写字上。到了三年级后,儿童将进入通过阅读学习的阶段,口语词汇可能会大幅度提高,这还需要今后更多的进一步研究。
教学启示
本研究发现作为一种低限制性技能的解码能力,汉字命名能力的个体差距在逐步缩小;而作为高限制性技能的言语理解能力,口语词汇发展的轨迹差距则保持不变。因此,在儿童学会阅读的过程中,教师对于识字教学应该充满信心,考虑到儿童阅读能力的长远发展,要做好长期积累口语词汇量、加强训练言语理解能力的准备。
基于汉字命名发展轨迹的分析结果,我们认为尽管小学低年级阶段的汉字命名发展轨迹呈现补偿模式,但是直到三年级,不同组间的儿童的差异仍然存在。这表明尽管汉字命名成绩差的儿童在后期发展较快,正在逐步赶上成绩好的儿童,但是他们仍处于落后的地位。因此从一年级到三年级,家长和老师仍然需要持续关注儿童的汉字命名成绩的发展,尤其需要帮助起点较低的儿童。
从口语词汇的分析结果可以看出,口语词汇在整个小学低年级阶段发展速度缓慢,呈现负加速增长。众所周知,口语词汇对后期阅读理解发展有着非常重要的意义。口语词汇的缓慢发展并不利于学生未来阅读理解能力的发展。然而这一阶段的语文教学以识字为主,可能对口语词汇教学有所忽视,这应该引起学校和老师的重视。对于小学低年级学生,教师除了常规的课堂学习外,还要鼓励学生多进行课外阅读、训练听说等口语交际能力,并倡导亲子阅读,以通过多种方式提高孩子的口语词汇量和言语理解能力。
摘要Abstract
This study explored the developmental individual differences and different developmental trajectories among 180 Chinese children from Grade1 to Grade3 on character naming and vocabulary.Study 1 found that there is compensatory model on character naming task.Study 2 found stable achievement gap on vocabulary task.The results of the traditional grouping method based on children’s first achievement were not stable.
Keywords
trajectories of reading development, Chinese children, character recognition, vocabulary
参考文献Reference
李虹,董琼,朱瑾,刘俊娉,伍新春.(2009).语素意识在学前儿童言语技能发展中的作用.心理科学,32(6),1291-1294.
Aarnoutse, C.& van Leeuwe, J.(2000).Development of poor and better readers during the elementary school.Educational Research and Evaluation, 6(3), 251-278.
Bast, J.& Reitsma, P.(1997).Mathew effects in reading: A comparison of latent growth curve models and simplex models with structured means.Multivariate Behavioral Research, 32(2), 135-167.
Baumert, J., Nagy, G.& Lehmann, R.(2012).Cumulative advantages and the emergence of social and ethnic inequality: Matthew effects in reading and mathematics development within elementary schools? Child Development, 83(4), 1347-1367.
Boscardin, C.K., Muthén, B., Francis, D.J.& Baker, E.L.(2008).Early identification of reading difficulties using heterogeneous developmental trajectories.Journal of Educational Psychology, 100(1), 192-208.
Cain, K.& Oakhill, J.(2011).Matthew effects in young readers reading comprehension and reading experience aid vocabulary development.Journal of Learning Disabilities, 44(5), 431-443.
Cook, T.D., Campbell, D.T.& Day, A.(1979).Quasi-experimentation: Design & analysis issues for field settings .Boston: Houghton Mifflin.pp.19-21.
Foster, W.A.& Miller, M.(2007).Development of the literacy achievement gap: a longitudinal study of kindergarten through third grade.Language, Speech, and Hearing Services in Schools, 38(3), 173-181.
Hoover, W.A.& Gough, P.B.(1990).The simple view of reading.Reading and Writing, 2(2), 127-160.
Kempe, C., Eriksson-Gustavsson, A.L.& Samuelsson, S.(2011).Are there any Matthew effects in literacy and cognitive development? Scandinavian Journal of Educational Research, 55(2), 181-196.
Kirby J.R.& Savage R.S.(2008).Can the simple view deal with the complexities of reading? Literacy, 42(2):75-82.
Lei L., Pan J., Liu H., McBride-Chang C., Li H., Zhang Y.et al.(2011).Developmental trajectories of reading development and impairment from ages 3 to 8 years in Chinese children.Journal of Child Psychology and Psychiatry 52(2), 212-220.
Leppänen, U., Niemi, P., Aunola, K.& Nurmi, J.E.(2004).Development of reading skills among preschool and primary school pupils.Reading Research Quarterly, 39(1), 72-93.
Parrila, R., Aunola, K., Leskinen, E., Nurmi, J.E.& Kirby, J.R.(2005).Development of Individual Differences in Reading: Results From Longitudinal Studies in English and Finnish.JournalofEducational Psychology, 97(3), 299-319.
Paris, S.G.(2005).Reinterpreting the development of reading skills.Reading Research Quarterly, 40(2), 184-202.
Pfost, M., Hattie, J., Dörfler, T.& Artelt, C.(2014).Individual Differences in Reading Development A Review of 25 Years of Empirical Research on Matthew Effects in Reading.Review of Educational Research, 84(2), 203-244.
Protopapas, A., Sideridis, G.D., Mouzaki, A.& Simos, P.G.(2011).Matthew Effects in Reading Comprehension: Myth or Reality? Journal of Learning Disabilities, 44(5), 402-420.
Rescorla, L.& Rosenthal, A.S.(2004).Growth in Standardized Ability and Achievement Test Scores From 3rd to 10th Grade.Journal of Educational Psychology, 96(1), 85-96.
Song, S., Su, M., Kang, C., Liu, H., Zhang, Y., McBride-Chang, C.et al.(2014).Tracing children’s vocabulary development from preschool through the school-age years: an 8-year longitudinal study.Developmental Science, 18(1):119-131.
Stanovich, K.E.(1986).Matthew Effects in Reading: Some Consequences of Individual Differences in the the Acquisition of Literacy.Reading Research Quarterly, 21(4), 360-407.
Xue, J., Shu, H., Li, H., Li, W.& Tian, X.(2013).The Stability of Literacy-Related Cognitive Contributions to Chinese Character Naming and Reading Fluency.Journal of Psycholinguistic Research, 42(5), 433-450.
Yeung, P.S., Ho, C.S.H., Chan, D.W.O.& Chung, K.K.H.(2014).What are the early indicators of persistent word reading difficulties among Chinese readers in elementary grades? Dyslexia, 20(2), 119-145.
Yeung, P.-S., Ho, C.S.-H., Wong, Y.-K., Chan, D.W.-O., Chung, K.K.H.et al.(2012).Longitudinal predictors of Chinese word reading and spelling among elementary grade students.Applied Psycholinguistics, Available on CJO 2012 doi: 10.1017/ S0142716412000239.
Zhang, J., McBride-Chang, C., Wong, A.M.Y., Tardif, T., Shu, H.& Zhang, Y.(2014).Longitudinal correlates of reading comprehension difficulties in Chinese children.Reading and Writing, 27(3), 481-501.
[1] 北京师范大学心理学院广州市越秀区朝天小学
[2] 北京师范大学心理学院
[3] 北京市西城区复兴门外第一小学