1988年,以贾科莫·里佐拉蒂(Giacomo Rizzolatti)为首的一群神经科学家,在意大利帕尔马开展了一项实验研究,试图了解位于恒河猴前运动皮层的神经元是如何控制抓握动作的(脑组织入门知识及其术语见书后附录一)。该团队采用了“单细胞记录技术”,在动物完成任务的过程中,以插入大脑的微电极探针测量单个神经元的电活动。换句话说,当一个神经元向其他神经元传递信息时,会发射出电信号,这种电信号叫作动作电位,也叫“峰电位”,微电极可以探测出这种动作电位的信号。我们可以把动作电位看作是神经元语言的基本元素,把单细胞记录技术看作一种窃听神经元对话的方法。实验证明,该方法是可靠的,经常被作为动物神经生理学研究的黄金标准。然而,使用该方法也容易犯错,尤其是在解读神经编码内容时,很难确定关于神经细胞的信息加工功能,放电模式到底能告诉我们哪些信息。
能够理解动作的神经元
当帕尔马团队开始进行实验时,该实验室先前开展的研究已经表明,猴子在执行抓握动作时,在脑中某个被称为F5的区域(额叶第5区;见图1-1)里,细胞产生了更强烈的放电。这种放电模式与抓握的具体动作有关:一些细胞在“精细抓握”时反应更大(例如用大拇指和食指拿葡萄干),而另一些细胞则在全手抓握时反应更大(例如抓起一只橙子)。看样子,在猴子抓握物体时,这些细胞似乎是对猴子可能采取的具体抓握类型进行编码。除此之外,前期实验数据还间接表明,当猴子仅仅看到可被抓握的物体时,F5区域的一部分抓握神经元也产生了放电。
图1-1 恒河猴的F5区与人类布洛卡区的对应关系
有意思的是,抓握过程中神经元所“偏好”的抓握类型(即放电最强的抓握类型)与观察过程中神经元所偏好的物体类型,两者往往是匹配的。
举例来说,只有在呈现小物件时,精细抓握对应的神经元才会有所反应。这表示物体形状与抓握该物体所需采取的抓握类型存在关联,而神经元的放电模式正是对这种关联进行编码的。基于这一观察结果,有关F5区神经元的可行假说即为:这些细胞表征了某类可能发生的运动动作的词汇库,物体的感觉特征输入后,会从运动词汇库中选择适合的动作1。例如,当看到一个网球大小的物体时,编码全手抓握的神经元就会被激活;而当看到一个葡萄干大小的物体时,编码精细抓握的神经元会被激活。
F5区神经元可能协调着物体的视觉信息与抓握动作的运动程序,这一观点有趣且重要,但要证明这个假设,还需要找出更多的证据。尤其是以视觉形式呈现物体信息时,研究者并未对抓握细胞此时的反应进行全面的刻画。其中一个很现实的难点在于:看见物体时,细胞会产生反应;紧接着要执行抓握动作,细胞也会产生反应;如何在两者之间进行区分呢?由于看见和抓握这两个事件在时间上存在部分重叠,所以,要确定究竟哪一个动作导致了细胞放电模式的改变是很困难的。研究团队设计了一个实验来规避这个问题2。
实验中,一只猴子独坐于一个箱子前,箱子的前门由一块单向玻璃构成,猴子完成任务时,研究者会记录其单个神经元的活动。接受训练后,猴子学会了通过按压和握住开关来照亮箱子内部,从而看清内部物体的具体大小和形状。在1~2秒的延迟后,箱门打开,猴子可以松开开关,把上肢伸入箱内取出该物体,并得到藏在物体下面的一小块食物作为奖赏。如果在设定的延迟时间结束之前,猴子先松开了开关,箱门就不会打开。这一设计确保研究者可以在延迟时间内对猴子看到物体时的神经反应进行测量,并将其与箱门打开后猴子伸手抓取物体的动作反应分离开来。
该实验最后得到的结果与研究的最初设计没有太大的关系。在各试次之间,当猴子坐在那儿等待完成下一个任务时,会看到实验者把手伸进箱内取出物体并置换食物的过程。而即使是在实验的休息时间里,猴子脑中的微电极仍然在记录它的神经活动。在这些间隔时间里,研究者观察到一些现象:当实验者为下个试次做准备时,会做出伸手抓取的动作,而研究者所监测的细胞中,似乎有相当一部分的细胞对此产生了反应。之前也有研究发现,神经元会对观察到的动作产生反应,但这些神经元位于感觉区,从未发现运动区的神经元出现这种反应3。不久,研究者进行了一个更正式的实验,目的在于记录下猴子大脑对动作观察的反应。
按照最初的实验设计,在测量了神经元对抓握任务的反应后,实验者自己充当起了实验刺激,在猴子面前做出一系列的动作。其中一些动作涉及一小块食物,包括将其放在物体表面,拿起来,递给另一位实验者,然后将其拿走。其他情况下,物体是破损的、折叠起来的,或是撕裂的。实验者摇晃手掌,举起手臂,做出威胁的姿势。他们还演示了指向物体的动作(例如抓起一颗并不存在的葡萄干),或者不用手,而是用工具来抓握物体。
实验结束后,该团队记录下184个神经元的数据。在猴子执行某些动作时,所有被记录的神经元几乎都产生了反应,这一结果与F5作为运动区的观点是相符的。但是,其中87个神经元还对某些视觉刺激产生了反应:48个神经元在出现简单物体时产生了视觉反应,这与先前的研究发现一致;另有39个神经元对动作观察产生了视觉反应。研究者发现,在这39个神经元中,其中12个神经元所偏好的动作观察,与它们所偏好的动作执行具有对应关系:如果这些细胞在执行用手抓握的动作时产生的反应最强烈,那么,在观察到相同的用手抓握的动作时,这些细胞产生的反应也会最强烈。其余27个细胞也对动作执行产生了反应,但它们在动作观察与动作执行的对应关系上并未表现出那么强烈的选择性。例如,有11个细胞不管是观察到用手把物体放在桌上的动作,还是执行抓握物体或将物体放到嘴边的动作,均会产生反应。对于动作观察偏好与动作执行偏好,这些细胞表现出了某种逻辑性,它们的编码规则似乎类似于“你放下一颗葡萄干,我拿起它”。对动作观察产生反应的39个细胞,在观察其他类型的演示动作(打手势、用工具抓取等)时,都没有产生反应。
1992年,该团队发表了一篇短文,报告了上述发现4。在文章中,关于为什么运动皮层的某些细胞会对动作产生反应,作者首先做出了假设性的解释:
针对感觉刺激提取出适合的运动动作,这是前运动皮层的主要功能之一。若考虑到猴群中存在大量的社会互动,那么,一只猴子对其他猴子动作的理解,对于决定动作选择无疑是非常重要的因素……(这一观点)与现有理论中有关前运动皮层功能的概念框架是相符的。
我完全同意这种解释,物体的大小和形状对动作选择非常重要。比如说,到底是用手指捏呢,还是用整个手掌来抓握呢?同样,其他动物的动作对于动作选择也很重要。运动区负责对自身动作进行编码并付诸执行;在知觉到他人的动作后,大脑的某种机制会将知觉到的信息传递给运动区,这种机制是合理的。
如果该报告以此解释作为结论,那么对于科学界来说,这些发现仍然是有趣而重要的,但它们永远不会登上报纸头条。但是,报告的最后一段继续围绕其中一些细胞,即动作观察与动作执行所偏好的动作类型高度对应的那12个细胞进行了说明。
作者指出,在以人类为对象的研究中,似乎也有两个领域出现了相似的观察-执行对应现象。其一是肢体失用症(limb apraxia),罹患该症状的个体难以执行随意运动。有报告称,肢体失用症患者在理解他人的肢体动作时也会出现障碍5。作者援引的第二个以人类为对象的研究领域是言语。这里,他们所指的是言语知觉的运动理论。20世纪50年代,美国康涅狄格州纽黑文市哈斯金斯实验室(Haskins Laboratories)的阿尔文·利伯曼(Alvin Liberman)及同事们提出了该理论,其基本观点认为:我们是通过重现发音的运动动作来获得言语知觉的,而不是通过在大脑中重现声音本身(第5章会对该理论进行更详细的介绍)。言语知觉的运动理论引发了持续数十年的研究,大多数研究并不支持该假设。然而,就像肢体失用症研究所发现的那样,言语知觉的运动理论主张动作知觉(包括言语知觉)依赖于运动系统。帕尔马团队在报告中得出了如下结论:
虽然我们所观察到的结果的确无法证明知觉的运动理论,但它们表明,位于前运动皮层区域的神经元具备某些特性,这些特性符合了运动理论的要求。有趣的是,F5区的解剖学位置,与人类大脑的布洛卡区在很大程度上是对应的。
从F5区到布洛卡区
把帕尔马团队的研究同布洛卡区(见图1-1)联系起来具有决定性的意义。虽然我们仍不清楚布洛卡区的具体功能,但长久以来,它一直被看作运动言语区。布洛卡区是大脑中两个经典的语言区域之一。19世纪60年代,法国神经学家保罗·布洛卡(Paul Broca)第一次将布洛卡区定义为言语表达的中枢6。解剖学上普遍认为猴子的F5区与布洛卡区是对等的。在发现镜像神经元之前,这种对等关系毫无意义,因为即使F5区与布洛卡区可能在解剖学上相关,但两者在功能上不存在任何实际联系,因为常见的假设认为,布洛卡区是言语区,而猴子并不会说话。但现在,基于F5区存在镜像神经元的事实,来自帕尔马团队的研究者指出,两者在功能上具有某种联系。这层联系是指,猴子F5区的“看-做细胞”,即镜像神经元,是人类语言进化发展的源头7。这层联系使我们能够利用在猴子身上发现的神经机制来解释人类认知的某些课题,从而大大提升了其理论价值。
●布洛卡区
大脑中两个经典的语言区域之一,由法国神经学家保罗·布洛卡发现,被认为是言语表达的中枢。
1992年的报告并未提及“镜像神经元”这一术语。当时,投身于更广阔的神经科学和心理学领域的科学家,绝大多数对镜像神经元一无所知,对作者所提出的猜想也一无所知,而这一猜想在接下来的近10年里产生了深远的影响。
1996年,里佐拉蒂的团队在《大脑》(Brain)杂志上发表了一篇论文,就这类新发现的细胞进行了更为详尽的阐述8。文章题为“前运动皮层中的动作识别”,所报告的研究与之前的实验基本相同,但这一次,有两只猴子参与了实验,并记录了F5区532个神经元的活动。该研究重复得出了1992年的大多数发现,当猴子抓握物体和观察实验者执行相同或相似动作时,F5区细胞均产生了反应。作者创造了“镜像神经元”这个术语来指代这一类细胞。
1996年《大脑》杂志发表的这篇文章表明,之前在一只猴子身上观察到的结果并非是意外事件,这一结果是可重复的。该文章也为镜像神经元与人类行为的关联性提供了更有力的支持。作者提出了一个问题:人类具有镜像系统吗?他们的答案是肯定的。文章对支持这一结论的三项证据进行了讨论,其中两项来自该团队自己的研究,另一项来自已有的文献:
●经颅磁刺激(TMS)
通过强磁场脉冲积蓄能量,产生电流反作用于大脑,激活脑组织或暂时干扰其功能。
●运用经颅磁刺激技术(transcranial magnetic stimulation,简称TMS)开展的研究发现,当人类观察到抓握动作时,与手部相关的运动兴奋性增强了9。经颅磁刺激是一种无创技术,令强磁场通过颅骨并聚焦于颅内大脑区域(有关认知神经科学的研究方法详见附录二),在接收刺激的区域,磁场会影响神经元的电特性。运用不同的刺激方案,经颅磁刺激技术能提高神经的兴奋性,也能抑制或干扰其活动。1995年,帕尔马团队进行了一项研究,他们使用经颅磁刺激来提高初级运动皮层区域的神经活动兴奋性。该区域控制着手掌和手臂,刺激这些区域会导致手掌和手臂的肌肉产生不自主的抽搐。利用附着在手掌皮肤上的电极,可以记录下这些抽搐的振幅,这些振幅被称为运动诱发电位(motor-evoked potentials,简称MEPs)。该研究发现,当人们观察到他人做出指向物体的抓握动作时,所产生的运动诱发电位比仅仅观察物体时更大。作者认为,该结果证明对动作的观察会自动激活与抓握相关的运动系统。
●运用正电子发射断层扫描技术(positron emission tomography,简称PET)开展的研究发现,当人类观察他人执行动作时,布洛卡区的神经活动会增强,而该区域被认为是猴子F5区的人类同源体10。正电子发射断层扫描是一种所谓的功能性脑成像技术(见附录二),这就意味着该技术能记录大脑的活动,而不是绘制出大脑结构的静态图像。当某个脑区处于活跃状态时,为了支持额外的活动,该区域的血流量会增加,以运送氧和葡萄糖等新陈代谢所需的物质。通过测量血流量的区域性变化,正电子发射断层扫描得以间接记录下脑活动。虽然正电子发射断层扫描技术及其最近开发出的表亲——功能性磁共振成像技术(functional MRI,简称fMRI)的测量对象都是血流量,只能间接反映神经元的活动,但对人类神经科学来说,却已被证明是极为有用的技术。里佐拉蒂团队发现,在观察动作时,布洛卡区的血流量增加了,该结果与动作知觉过程涉及人类运动系统的观点是一致的。
●正电子发射断层扫描(PET)
一种血流动力学成像技术,通过血流量的变化来间接测量大脑的活动。空间分辨率良好,但时间分辨率很低。
●有报告称,在大致接近布洛卡区的额叶部位出现脑损伤的病人,表现出一种手势识别缺陷。神经学的文献证明,语言障碍(失语症)患者有时也会出现手势识别缺陷,无法判断手势所表达的意思。这显然与镜像神经元的功能问题是相关的,因为手势识别可以被解释为动作理解的一种形式。在1996年前后,虽然当时人们一致认为,导致这些缺陷的损伤并不涉及布洛卡区,但根据有关动作观察的正电子发射断层扫描研究,帕尔马团队指出,导致手势识别缺陷的正是布洛卡区的脑损伤。
里佐拉蒂和同事们获得了证明猴子具有镜像神经元的证据,以及三条间接证明人类也具有类似系统的证据,这篇1996年发表于《大脑》杂志的文章最终得出结论:人类不仅具有镜像系统,并且,布洛卡区是该系统的重要组成部分。布洛卡区是猴子的F5区在人类大脑内所对应的区域,该区域也与动作识别有关:“对上述各种证据的综述似乎表明,F5区和布洛卡区都能对手部动作进行表征,并且,它们很可能具有相似的动作识别机制。”
在1992年的文章中,就镜像神经元对人类言语的作用,研究团队以用词更加强硬的推测作为文章的结论。
考虑到猴子F5区与人类布洛卡区的同源性,我们不由得做出如下推论:人类布洛卡区应该存在一种与猴子的“镜像神经元”性质类似的神经元,该神经元是对发音动作进行编码的,并且,它应该表征着言语知觉的神经生理学基础。
数年后的2002年,有报告称,在F5区之外发现了镜像神经元。这些神经元位于猴子顶叶的感觉运动区域,该区域被称为PF区(见图1-1)。如果位于顶叶的镜像神经元先被发现,那么,它与言语之间的联系或许不会如此明显,也不会产生这么大的影响。但那并没有发生。在顶叶的镜像神经元被发现之时,猴子F5区的镜像神经元、人类布洛卡区以及言语之间存在的假设性关联已经被普及到了整个研究领域,其影响是深远的。如果猴子的镜像神经元可以破解大脑如何加工言语的问题,那它也有可能为理解人类行为的更多领域创造条件。这种神经元被亚科博尼称为“微小的奇迹”。在20世纪90年代末期及之后的10年,就这种神经元在人类中的应用所开展的研究和理论化工作呈爆发式增长。正如下一章所展示的那样,猴子的镜像神经元似乎真的可以解开人类心理的谜题。