强化物和强化策略
——拿什么来改变孩子的行为
强化物的概念和强化策略是ABA中最核心、最基本的内容,也是我们用好ABA必须深刻理解、灵活运用的。在所有其他策略中,都包含着强化策略的使用,所以我们把它放在其他策略之前介绍。
日常生活语言中的“强化”一词,往往表示增强、加固的意思。ABA所讲的“强化”,内涵与此既相似又有所区别。在教科书里,强化物指“发生在行为之后,能提高该行为出现频率的事件”。简单地讲,任何可以使孩子行为增加的东西,都是强化物。它可以理解为我们手中的“果子”,通过控制它就可以使孩子达到我们的要求。
还记得之前举过的小尼吃苹果的例子吗?
在这个例子中,“好吃又解渴”的感觉就是小尼的强化物,它强化了小尼吃红苹果的行为,使他今后见到红苹果还会愿意吃。而在另一个例子中:
这里,“妈妈回来”是“哭”这个行为的强化物,它强化了孩子“哭”的行为,这就是为什么小康老师会说:“反而是那些太心疼孩子的,一听见哭声就赶紧回来哄哄的,孩子哭得更厉害!”
通常,可以把孩子喜欢的事物当作强化物来使用,以增加特定行为出现的频率。比如,当孩子表现出一定的好行为时,就给他一个喜欢的东西,让他有愉快的感受,这会使他今后更多地表现出这种好行为。这个过程就称为“强化”。利用“强化物”“强化”孩子的好行为是ABA最基本的策略。
在进一步介绍强化策略前,先来详细了解一下强化物。
强化物有不同的种类。在日常生活和教育训练中,您不妨从下面几种强化物中寻找可用的、适合自己孩子的。
(1)物质强化物
顾名思义,物质强化物是指看得见、摸得着或者闻得见、听得着的东西。比如,孩子们通常喜欢的饮料、水果、饼干、奶酪、面包、花生、爆米花等,还包括他们喜欢的画片、香水、气球、玩具等等。前面那些被称为“初级强化物”,即能够直接满足孩子生理需求的东西。与之对应的是“次级强化物”,就是虽不能直接满足生理需要,但同样能使孩子产生满足感和快乐感的东西。
(2)社会性强化物
社会性强化是最常见的强化方式,有时也是最方便给予、效果最好的强化方式。一个会心的微笑、一句由衷的称赞、一个拥抱、一个大拇指,都可以使孩子体会到快乐的感觉,从而强化之前的行为。有时,大人的关注也是孩子想得到的社会性强化物。
(3)活动性强化物
一些孩子喜爱的活动也可以作为强化物使用。比如,挠痒痒这样的小互动游戏、玩电脑游戏、听音乐、散步、玩水、玩沙、画画、转圈等等。在孩子表现良好时,不妨多带孩子做做他喜爱的活动,这样既能起到强化的效果,又在活动中锻炼了其他方面的能力,还能培养和孩子之间的感情。
(4)代币强化
代币强化物与前面讲到的三种不同,它不是指具体的强化物,而是一种给予强化物的方式。日常生活中最常见的代币强化物就是钱。在孩子们的生活中,也经常可以见到代币强化的形式,比如在幼儿园中,老师常用“小红旗”“五角星”奖励孩子,到周末时得到最多“小红旗”“五角星”的孩子就会有更大的奖励。在儿童教育机构有许多灵活使用代币强化的例子,比如,有的老师发明了“小奖票”,每当孩子表现突出时,就发给他一定数量的小奖票,并且规定了这些奖票的“购买力”:5张奖票可以换1支铅笔,10张奖票可以换1块彩色橡皮,15张奖票可以换1个铅笔盒,30张奖票可以换1辆小汽车……在家庭中也可以借鉴这种方式。比如,在上课时,每做对一次就给孩子1颗小珠子,并与他约定,每攒足5颗或10颗小珠子时,就可以得到想要的物品或活动。
在选择强化物时,要注意如下几个原则。
(1)要选择孩子真正喜欢的强化物
许多家长和教师都知道,“行为和兴趣不同于常人”是孤独症儿童的三大特征之一,但在教学和生活中却往往忽视了这一点。在选择强化物的时候,将自己的意志强加给孩子,主观地以为自己选择的东西自然是他们所喜欢的。实际上,大部分孩子喜欢的物品是和常人不同的。一块路上捡来的小纸片、一枚硬币、一根头发、一个塑料袋,都可能是孩子的心仪之物。另外,不同孩子之间是不一样的,一个孩子喜欢的物品,另一个孩子可能不喜欢。而且在不同的时间、地点,同一个孩子喜欢的东西也可能是不一样的。所以,选择强化物时不可想当然,要解放思想,善于观察,找出适合自己孩子的强化物。
也许有人会问,如果给孩子用十分怪异的物品作为强化物,是否会助长这种怪异的兴趣?对这一点的担心是可以理解的,我们当然希望孩子的行为越趋向“正常”越好。其实洛瓦斯教授从前也有类似的顾虑,非常反对将孩子喜欢的自我刺激行为(如转圈、摇晃脑袋等)作为强化物使用,但后来他的态度有所改变,不再对此明确表示反对(尽管仍不提倡),而是认为实在找不到合适的强化物时,可以使用自我刺激行为强化儿童(也就是当孩子做得好时,允许他有一点自我刺激的行为满足一下)。因为干预者首先要考虑的不是要消除怪异兴趣和行为,而是如何激励孩子的学习动机。如果没有好的强化物,孩子就不太可能投入到学习和训练中来,结果连最简单的技能都建立不起来,何谈“趋向正常”呢?
(2)要选择孩子目前非常渴望得到的东西
当我们非常饿的时候,就愿意花费力气做饭,但如果已经很饱了,谁也不会主动下厨房(厨师除外)。孩子也是一样的。这告诉我们,使用强化物时要考虑孩子当时的状态。比如,如果正在教孩子“跳绳”这样一个耗费体力的活动,那么就不宜将他喜欢的“踢球”作为强化物——跳绳后很累时,踢球就不是享受而是负担了。同样,在孩子刚吃完午饭时,不要用食品作为强化物。这一点给我们的启示是:要灵活掌握“剥夺原则”。所谓“剥夺”,就是要创造孩子的生理或精神状态,使他渴望得到某种强化物。比如,如果我们想用饮料作为强化物,那么最好在学习之前不要给孩子喝饮料,创造孩子渴的状态,这样能够保证饮料的强化效果。当然,这种有失人道的办法,是不提倡使用的,只能在不得已时偶尔为之。
(3)即使大量使用也不会对孩子的身体发育造成伤害
一些热量过高或含有有害物质的食物,作为经常使用的强化物就不太适当。如薯片、碳酸饮料,食用多了就对孩子的身体不好,应尽量避免将其作为强化物。
(4)便于收回
在密集的教学过程中,在孩子消费一会儿强化物后,总要收回强化物好继续进行接下来的学习,所以强化物应该是便于收回的。比如,一串系有长绳的钥匙,如果可以作为强化物,使用前也最好先把绳子解掉。同样的道理,口香糖是不适合在上课过程中作为强化物的,无论孩子有多么喜欢它。
(5)不易通过其他途径获得
也就是说,孩子只有在完成某项要求之后,才可能获得。如果在生活中随处可以得到相同的强化物,那么在学习中这些强化物的效能就不强了。有的老师要求家长在家里最好不让孩子见到他们在学校里使用的强化物,就是基于这样的道理。
(6)要便于收集、便宜
就是要掌握“经济”的原则。经常使用的强化物应当是生活中可以很方便地收集到的,而且不应花费过大。
(7)不产生“竞争性”行为
也就是“一心不能二用”。试想一下,当你手把手地教孩子穿衣服时,如果用“奥特曼”当作强化物是不是合适呢?肯定不是,因为玩奥特曼和穿衣服都是需要用双手进行的活动,它们之间构成了“竞争”,就会互相干扰。
选择好了强化物,使用强化策略就有了基础和依托。简单讲,就是在孩子表现出好的行为时,通过给予强化物强化这种行为(让好行为有“好果子”吃)。
轩轩是一个好动的孩子,平时在家里基本上没有安静的时候,嘴里总是在叫喊着什么。轩轩很喜欢看电视,爸爸决定只有在他安静的时候才让他看一会儿电视。通过这种策略,逐渐地让轩轩养成了在家里保持安静的好习惯。
在“扬善抑弊,赏罚有度”这句话中,强化策略体现的是一个“赏”字。如何赏?度在哪里?有以下几点需要我们注意。
(1)注意强化的强度
通常的概念是,强化的强度越高,强化的效果越好。这基本上是对的,但在学习过程中,无论从时间、经济、精力上都不允许无限度地提高强化物的强度。为了使有限的强化物在可能的范围内达到最佳的效果,要掌握“依从性原则”。也就是,让强化物的强度和孩子的表现挂起钩来,在二者间建立“依从性”关系——孩子的表现越好,得到的强化就越大,表现稍次,得到的强化就稍次,甚至得不到强化。而评判“好”的标准,应当以孩子自身以前的表现为参照,不可以其他孩子的表现为参照。
(2)注意强化的时机
对于一项全新的技能来说,如果强化物能够紧随行为之后出现,强化效果是最好的。这告诉我们在教孩子学习新的内容时,强化物一定要给得及时,不可耽误。比如,一个从未叫过“爸爸”的孩子某天突然叫了一声“爸爸”,为了保持他的这个行为,我们必须马上给予强化。不过,并不是在任何情况下都应马上给予强化。对于孩子已经掌握了的学习内容,强化物可以不必立即出现,甚至可以不出现。比如,对一个已经能熟练地叫出“爸爸”的孩子,就不必每当他叫时都立即给予强化了。
因此,一定要把握好给予强化物的时机,该快就快,不该快就慢。在学习新内容的时候,给强化物要快;在练习或复习已掌握的内容时,不必那么快。
(3)注意差别强化物和贿赂
有的家长喜欢这样调动孩子的积极性:“只要你把这个做了,我就给你吃豌豆脆!”这不是强化,而是贿赂。贿赂虽然能暂时起到让孩子配合的目的,但长远来看,这种方式贻害无穷,它只会增长孩子对强化物的依赖,助长孩子和你讨价还价的行为。强化和贿赂最为重要的区别,在于贿赂出现在行为之前,强化则是发生在行为之后。
请记住,一定不要以贿赂的方式使用强化物,要让强化物变成孩子的惊喜。
苗苗的家长请小卫老师每天到家里来为苗苗做训练。小卫老师和苗苗接触的第一天就发现了一个问题:在要求苗苗做某件事情(比如模仿老师的动作、和老师一起整理教具箱)时,苗苗总是把目光投向老师的手,好像在寻找什么。小卫老师意识到她可能在寻找强化物。在问过苗苗妈妈后,小卫老师证实了自己的判断:从前苗苗的家长习惯于在苗苗提要求时,先出示她喜欢的薯片或电话卡,说:“你只要做了……就给你!”长此以往,苗苗养成了在做事之前先“谈条件”的习惯,看不到自己喜爱的东西就拒绝配合。
为了帮苗苗改掉这个坏习惯,小卫老师想出了这样的办法:用自己制作的小红花代替薯片和电话卡,每天上课前告诉苗苗:“如果你表现得好就可以得到小红花,表现越好小红花就越多。下课后你可以拿小红花来和老师交换薯片和电话卡,每五个小红花就可以得到两块薯片(或者一张电话卡)。”由于苗苗的语言理解力还不错,她很快理解了这个规则。在上课时,小卫老师对苗苗提要求之前并不出示小红花,而是在她答对问题或者做对事情后马上夸奖她并且立即给她一个小红花。而每当苗苗表现不好或试图和老师“谈条件”的时候,小卫老师就严肃地告诫她并且从她已经得到的小红花里拿走一朵。下课后,小卫老师会根据当天苗苗得到的小红花数量决定奖励的数量。
经过几天这样的练习,苗苗了解到只要自己听老师的话就一定能够得到奖励,反之就没有。逐渐地,苗苗在小卫老师的课堂上改掉了做事前先“谈条件”的习惯,学会了在得到强化物之前先忍耐一段时间。通过苗苗家长的配合和泛化,苗苗在家里的其他时间也不再和大人们“谈条件”了。
苗苗谈条件的坏习惯,是由于大人们经常采取“贿赂”的方式养成的。这样的习惯并不好去除,所以小卫老师采取了用小红花代替实物的办法,使苗苗不能直接看到强化物,从而增强了她的忍耐性。最重要的是,小卫老师在课堂上坚持了“先做事再出示并给予强化物”的原则,最终逐步消除了苗苗对强化物的依赖。在这个例子中,“小红花”是一种“代币强化”的形式(参见后文中关于代币强化的介绍)。
(4)注意强化程序
所谓强化程序,就是给予强化的频率、间隔,它可以分成四类。
固定比率的强化是指好的行为每出现几次(可以是一次,也可以是两次或更多次)就给予强化。
可变比率的强化也按照好行为出现的次数来强化,但不那么固定,可能出现一次就强化,也可能出现三次、八次才强化。固定比率和可变比率的强化,是最常见的强化程序。固定时距的强化是按照时间间隔来决定强化的时机。
小黄是一个听话的孩子,在一对一的教学当中总是很配合很努力。可是一旦老师或妈妈不在身边时,他的表现就不那么好了——一会儿看看天花板,一会儿把收拾得整整齐齐的学习材料故意搞乱。为了让小黄养成独自学习的好习惯,妈妈决定采用强化的手段,她每天安排一段时间,让小黄独自一个人在房间学习。每隔两分钟,妈妈会进房间看一下,如果小黄是在认真学习,就给予夸赞和奖励。过了几天,妈妈发现小黄似乎掌握了这个规律,好像只在自己快要进屋查看的时候才将注意力转到学习上来。于是她调整了策略,改为不定时地进屋检查。这样小黄再也不能钻空子了。经过一段时间,小黄在独自一人的情况下也能安静地学习了。
这个例子里,妈妈头几天所采取的就是固定间隔(以两分钟为间隔)的强化程序,而之后则采取了可变时距的强化程序。
有研究表明,可变比率强化程序(可变比率和可变时距)比起固定的强化程序来(固定比率和固定时距),能更有效地维持一个行为。比如,在生活中最常见的可变比率强化的例子就是“老虎机”:一个人正是因为不知道投币下注几次才能得到金光闪闪的回报才不停地投币。
(5)要适时淡出强化
在自然的状态中,并不是每做一件好事都能马上得到强化。为了让我们的孩子适应这样的世界,就必须减少强化。减少强化的方法有两种:第一种方法是减少强化的强度。比如,物质强化的强度:从开始的给一大片薯片,到后来给半片、四分之一片;代币强化的强度:从开始的给五颗五角星,到后来的给一颗五角星;社会性强化的强度:从开始的大声赞扬“太棒啦!!!”到后来的轻声说“嗯,不错”。第二种方法是减少强化的频率:从开始时每做对一次就给强化,到后来每做对三次才给予强化。或者是从固定的强化(每做对一次给强化)过渡到可变强化:有时做对三次给一次强化,有时五次给一次强化。
洛瓦斯曾说过“越是经济地使用强化物,它的效能才越大”,讲的就是要淡出强化的道理。
除了上述几点外,还需要注意一些容易陷入的误区或容易被人忽视的方面。
(1)强化是一个过程,而不是简单地把强化物塞给孩子
细心的读者可能已经注意到,本小节开头所引用的强化物的概念是:“发生在行为之后,能提高该行为出现频率的事件。”按照习惯的理解,强化物似乎是指“物品”,而这里却将强化物定义为“事件”。这不是在做文字游戏,而是包含了非常重要的道理。
老师发现小A最近喜欢上了一个牙膏盒,于是让小A的妈妈从家里带了好些牙膏盒到学校里,准备作为强化物,在小A表现好的时候让他高兴高兴。但是过了两天,却发现效果不太好,小A似乎并不喜欢妈妈拿来的盒子。老师无奈之下只好将最初的那一个牙膏盒拿了回来,小A果然又对其爱不释手。通过观察,老师发现,原来小A喜欢这个牙膏盒,是因为这个盒子的开口处破了一个小洞,小A最喜欢做的是不停地用小手指捅进这个小洞,似乎在享受探秘的乐趣。而妈妈拿来的牙膏盒没有任何破损,小A当然不喜欢了。
在这个例子里面,小A的强化物不是牙膏盒,而是“用手指抠牙膏盒”这个行为,或称为“事件”。我们的强化过程不应仅仅是把某件强化物交给孩子即可,而应该保证孩子能够享受到“消费”强化物的过程。比如,有的孩子喜欢把积木一块一块地垒起来,那么只给他一块积木作为强化物显然是不适当的,应该创造条件使他能够以自己喜欢的方式玩积木,例如,可以每次给一块但不收回积木,让孩子可以逐步地把积木垒起来,享受这个过程。
(2)想方设法地强化孩子的内部动机
著名的教育心理学家奥苏伯尔曾提出,学习的动机主要由三个方面的内驱力组成:认知内驱力、自我提高内驱力和附属内驱力。认知内驱力是从好奇的倾向中派生出来的,是理解事物、掌握知识的心理渴望。这种内驱力是发自内心的,在没有外物强化时也会使学生产生强烈的学习动机。自我提高的内驱力,是指学生因自己的能力而赢得相应地位的需要。与认知内驱力不一样,它并非直接指向学习本身,而是把好的表现看作赢得一定地位和自尊心的根源。附属内驱力是指一个人想获得自己所附属的长者(如家长、教师)的赞许或认可,取得其赏识的欲望。上面三种内驱力中,认知内驱力是基于学习任务本身的,无需外部的附加条件,可以称为“内部动机”。研究表明,认知内驱力在学习中是一种最重要和最稳定的动机,它对学习起很大的推动作用。
在教育孩子的过程中,我们要注意内部动机的培养,即让孩子从完成任务的过程中体会到成功的喜悦、胜任的快乐。只有帮助孩子建立内部动机,他们才有可能适应将来学校集体学习、集体生活的环境,因为在这种环境中,是不可能在每次完成一项任务后都能得到及时的外部强化的。
奥苏伯尔指出,学生的认知内驱力并非天然就有,而是在学习过程中,由于多次获得成功,体验到满足需要的乐趣,逐渐巩固了最初的好奇心,从而形成、稳固下来的。成功的学习经验可以增强孩子的认知内驱力,而反过来,认知内驱力又对学习起推动作用。可见,认知内驱力和学习之间的关系是互惠的,内部动机可以在学习中逐步培养。
(3)多使用自然的强化
所谓自然的强化,就是指强化物与行为能自然关联。比如,一个人做了一盘好菜,此时对他自然的强化应该是让他吃这盘菜,或享受大家由衷的赞美,而不是给他一些钱,让他去外面的饭店买菜吃。比如,对于“拉开抽屉”或“拧开瓶盖”这两个学习内容,自然的强化应该是:在抽屉里放上孩子喜欢的糖果,或在瓶子里灌好孩子喜欢的饮料,让孩子完成动作后能自然地得到糖果和饮料,而不是从外面拿来糖果和饮料给孩子。再比如,如果要教孩子学习拿勺子舀饭,最自然的强化物应该是他舀到的饭。
越是自然的强化物,孩子越有可能在日常生活中遇到。如果我们在教学中多选择使用自然的强化物,让孩子适应、习惯这些强化,那么在日常生活中孩子再遇到这些强化物时也能同样起到强化的作用,也就是说自然的生活环境自动地强化了孩子。这不光能节省我们的精力,还能保证孩子得到的强化更加及时、充分。这能够很好地帮助孩子将学到的技能泛化到日常生活中去(参见第七章第二节的内容),所以在教孩子学习某项技能时,应当尽可能寻找自然的强化物。
请思考:如果想教孩子“认识颜色”“翻书页”,怎么设计自然的强化物呢?可行的方法是用红色、绿色等各种颜色的糖豆教孩子认识颜色(如果孩子喜欢糖豆的话);在书页上贴上孩子喜欢的人物或物品的图片。
(4)适当考虑负强化
强化有正强化和负强化之分。所谓正强化,是指在孩子做好一件事后,得到了一件喜爱的东西,从而起到了强化效果。而负强化则正好相反,是指在孩子做好一件事后,摆脱了一件他不喜欢甚至厌恶的东西。这同样能起到强化的作用。在之源的例子中,对于之源来说,发生了什么呢?
“复述故事的要求”对之源来说是一件厌恶的事,该要求被收回对他是能够起到强化作用的,它所强化的正是拍桌子和嘟囔的行为。所以我们说,之源这次得逞的经历,很可能会使他以后出现更多类似的行为。这就是典型的负强化的例子,只不过起到了不好的作用。但是只要运用得当,负强化也可以为我们所用,强化孩子的好行为。
在一项大小便训练方案中,有这样的一条策略:当孩子尿湿裤子后,不给他换掉裤子,而是马上进行如厕练习,练习结束之后再换裤子。这样一来,只要孩子配合完成了练习,就能够摆脱湿漉漉的裤子带给自己的不佳感觉。这是对他配合行为的很好的负强化。
强强很不喜欢教室里的音乐声,但是他在下课后必须将小椅子摆放好才可以走出教室。为了尽快摆脱令人讨厌的音乐,强强很快将小椅子摆放好,快速离开了教室。
这里,对音乐的摆脱就是一个负性的强化物,它增强了强强摆放小椅子的行为。
妈妈上午安排的任务是串珠子练习,这是精细动作技能不佳的小凌最不擅长的任务,所以做得很烦躁,好几次想逃离课桌,可妈妈就是不让他走。小凌很努力,但珠子就是不听话,总是从手里滑落下来。小凌急得没有办法,抬起头对妈妈说出了一句话:“不做了。”这是小凌第一次主动向妈妈表达“不要”之类的需求!妈妈很高兴,马上就说:“小凌说不做,那就不做了!”然后让小凌放下珠子,到一旁自己玩去了。
这个例子中,妈妈正是运用了负强化的方法,帮小凌摆脱了“串珠子”这个令小凌厌烦的学习活动,强化了小凌用语言表达“不要”的行为。
(5)多考虑使用代币强化的方式
前文讲过,和其他强化物相比,代币强化具有不可比拟的优点:首先,它可以使孩子的学习过程不会被不停消费强化物的过程所打断;其次,它可以培养孩子等待实际强化物的耐心;它还可以帮助孩子建立“交换”的概念。所以,对于有效的ABA方法来说,代币强化是不可或缺的一种强化方式。那么,如何使用代币强化呢?如果孩子不能理解代币、交换的概念怎么办?
其实不必担心孩子对代币的理解能力,经验表明,所有孩子都能很快明白自己得到的小红旗、五角星的用途——给出它们,就能得到自己更想要的东西。为了帮助孩子更好地理解代币的概念,可以在最初使用代币时,规定每一个代币都可以交换一件物品。每当孩子得到一个代币,马上手把手地教他把代币交给成人(可以是训练者,也可以是另一个人),然后得到自己喜欢的物品,重复几次这样的过程,孩子就能够理解代币的含义。之后,再逐渐将代币“贬值”,规定每两个、每三个直到每五个、每十个代币交换一件物品。通过这样循序渐进的过程,让孩子习惯代币的使用。
实际上,代币不仅可以用来作为强化手段,还可以用于惩罚——如果孩子做错了某件事,就收回他的一个或多个代币。这种惩罚不直接从孩子那里剥夺实际物品,因而不容易引起孩子特别强烈的反抗,但却仍能起到惩罚的效果(参见第三章第六节的内容)。
代币也有很多种,除了小红旗、五角星外,卡片、小印章等等都是可选的方式,也可以利用表格等形式代表代币(参见第四章第三节的内容)。
【延伸阅读】负强化与惩罚的区别
由于都涉及了令人不愉快的感觉,所以许多人甚至一些专业人员都容易把负强化和惩罚弄混淆。实际上搞清楚二者的真正含义,区分它们并不难。最根本的一点是,惩罚是为了减少某种行为,而强化(不管是正强化还是负强化)是为了增加某种行为。目的不同,手段也就不同:惩罚是给人施加某种不快的感觉,而负强化则是帮人去除不快的感觉。
(1) 注:有关功能分析的相关内容参见《功能性行为评估及干预实用手册(第3版)》(Functional Assessment and Program Development for Problem Behavior: A Practical Hand Book: 3rd edition),[美]罗伯特·E.奥尼尔等著,陈更娟译,华夏出版社,2018年出版。