第三节 认知神经科学的方法学
认知神经科学方法包括两大类互补的研究方法:一类是无创性脑功能(认知)成像技术;另一类是清醒动物认知生理心理学研究方法。前一类方法中又分为脑代谢功能成像和生理功能成像两种;后一类方法中包括单细胞记录、多细胞记录、多维(阵列)电极记录法和其他生理心理学方法(手术法、冷却法、药物法等)。本书主要介绍无创性脑功能成像技术,其中脑代谢功能成像包括正电子发射断层扫描技术(PET,对区域性脑代谢率、脑血流和葡萄糖吸收率的测定)、单光子发射断层扫描技术(SPECT,对脑血流测定)、功能性磁共振(fMRI,通过氧合血红蛋白测定血氧水平相关的信号,BOLD)。这些脑代谢功能成像技术的空间分辨率和时间分辨率各不相同。PET的空间分辨率在20世纪80年代为1.75 cm,90年代提高为6~7 mm,其时间分辨率由分钟数量级提高为秒数量级,现在约40~60 s可给出一幅清晰图像。fMRI的空间分辨为毫米水平,时间分辨率最高可达50 ms,一般100 ms,即0.1 s就可给出一幅图像。由此可见,fMRI无论就其空间分辨率还是时间分辨率均优于PET。脑代谢功能成像对于快速认知活动无法做到实时成像或快速跟踪,采用积分测量法(integrated measurement),则将数十秒数据积分起来可形成清晰的图像。然后进行对照的认知实验,将两种认知条件不同的图像采用减法处理,即完成A认知任务的PET图像减去无A任务的对照PET图像,所得差值为A任务操作的脑代谢功能差异。除减法法则外,还利用一致性分析(consistent analysis),即将A任务减A对照组的差值与B任务减B对照组之差值再相减,以作为完成不同认知任务的脑代谢功能的特异性变化的脑代谢基础参数。
无论是减法法则还是一致性分析,虽有一定的实验心理学基础,但它在一定的前提下才可靠。首先,用减法法则意味着脑内的认知过程信息加工是串行的,按一定方向无曲折地层次性处理过程。被试在完成认知作业时,忠诚执行指示语要求,并毫不分心地完成作业。此时参与这项认知任务的脑结构与其他心理活动的脑结构分离而不相干。只有这样,其减法所得结果才与所进行的认知活动完全相关。显然,这种约束条件在实现PET认知测量中是很难满足的。
第二类生理功能成像是在自发脑电活动(EEG)、诱发脑电活动(EP)和脑磁(MEG)场变化的基础上,结合计算机控制的断层扫描技术(CT)而实现的。它的时间分辨率极为理想,可实时跟踪认知活动的脑功能变化。但在记录的头皮电极为19个电极时,空间分辨率为6 cm;41个电极时为4 cm;120个电极时为2.25 cm;256个电极时为1.0 cm。由此可见,其空间分辨率很不理想。为提高其空间分辨率,采用了偶极子(dipole)算法,但常常发现所得结果不是唯一的。虽然生理功能成像技术时间分辨率佳,技术所耗资金少是其优点,但其空间辨率却无法满足认知神经科学的要求。因此,近年将脑代谢功能成像与生理功能成像结合起来应用,取各自之长相互补充,以满足空间和时间分辨率的要求。在多种脑认知成像技术应用中,为了比较各种方法所得图像之间的关系,必须进行多种比例性立体变换。这些变换不仅以解剖学定位标志为标准,还要以10多种脑数据参数进行线性和非线性变换。因此,这是一项技术难度很大的研究工作。尽管如此,脑认知成像对于认知神经科学的要求,仍存在许多问题。首先,脑代谢功能成像的激活区反映出脑代谢率或脑区域性血流量的增加,与神经元的兴奋性水平并非总是平行性变化,特别是对于抑制性神经元而言,代谢率增高,导致神经元单位活动的降低。实际上,脑抑制性神经元和兴奋神经元的分布至今尚难以给出明确的答案。因此,代谢功能成像的激活区是否能代表神经元功能活性的问题还需进一步实验研究。其次,在代谢功能成像分析中,每个场激活区至少为0.8 cm3,即使假设为1 mm3,则至少含有数以万计皮层神经元(105细胞/mm2皮层),不能设想这么多神经元都是在同步性发放,功能均一地发挥生理心理功能。总之,脑认知成像技术可以为我们对认知过程的脑功能形成直观的图像。然而这种图像仅可提供结构或区域性功能关系,对于细胞水平的机制显然过分粗糙。下面我们选取几种常见的认知神经科学方法进一步加以讨论。
一、脑功能之窗——事件相关电位和高分辨脑电成像技术
脑功能之窗的提法已有20多年的历史,但它的真正含义只是脑功能成像技术问世以后,由于脑电成像和其他脑代谢成像联合运用,才显示出它们作为脑功能之窗的本意。20世纪20年代,德国精神病科医生Berger面对许多精神病的诊断问题,决心寻找一种检查人脑功能的方法,以便作为诊断精神病的重要根据。他利用当时物理学上最灵敏的弦线式电流放大器经过反复的试验,终于在1925年,从安静闭目的人头上记录出8~13次/秒变化的波形。每当睁开眼睛后,这个曲线就被幅值很小、变化更快的波形所代替。他把这个发现写成文章寄给德国生理学杂志,一些审稿专家都认为这些波形不是发自人脑,而是来自记录仪器的不稳定性。直到1929年经当时世界最著名的意大利电生理学实验室反复验证,才证明伯格医生在人头皮上记录到的8~13次/秒节律变化,确实是发自大脑的电活动,并把该节律称为伯格节律或α波,把睁眼后的低幅快波(14~30次/秒)称为β波。
20世纪30~50年代,人们一直努力发现一些新的脑电波,试图用以诊断精神疾病,都没有成功。但脑电活动的记录用于诊断癫痫和脑瘤等占位性病变却得到了广泛的应用。但伯格医生的心愿至今未了,脑电图(EEG)至今仍无法作为诊断精神病的重要手段,更无法作为探究脑认知功能的有效手段。然而,20世纪60年代以后通过许多信号处理技术,已能分析出认知活动的平均诱发电位。脑的自发活动α节律大约在25~75μV范围随机地波动,而人的认知过程或外部刺激诱发的电活动小于1μV,淹没在自发的α节律之中。因此,在20世纪60年代以前,无法在正常人类被试的认知活动中观察脑的诱发电变化。随着信号处理技术的发展,利用时间锁定叠加的办法,多次重复同一刺激,使诱发反应逐渐加在一起,而自发活动由于其本质是随机变化的,叠加中相互抵消。这种时间锁定叠加技术可以提高信号与噪声的比例,使自发脑电活动背景上的诱发活动能够检测出来,这就是平均诱发电位。
平均诱发电位是一组复合波,用组成成分的潜伏期和波幅对其进行分析。刺激之后1~10 ms的一些小波称早成分,10~50 ms的波称中成分,50 ms以后的成分称晚成分。早、中成分主要反映感觉器官和传入神经通路的活动,晚成分才是认知过程脑功能变化的生理指标。对于认知活动来说,可以把诱发其产生的内外刺激看成事件,而这些晚成分就是事件引起的脑电活动变化,故称之为事件相关电位。脑事件相关电位的变化与被试接受的刺激和脑功能变化的时间尺度能精确地一致。换言之,脑电活动的时间分辨率很高,可以实时记录认知过程的脑功能变化。但其空间分辨能力较差,头皮外记录的脑电活动很难分析出是脑内哪些结构或细胞群活动的结果。为了克服事件相关电位分析的这一弱点逐渐增加头皮上记录的点数,从原来常用的8导增加为12导、21导、32导、64导、128导和256导。随记录部位的增加,得到较多的数据,就可以通过一种偶极子的算法求解出每一电活动成分由脑内发出的位置。把这种分析的结果变换成断层扫描图,就称为高分辨率或高密度脑电成像技术。
二、心灵窥镜和脑断层扫描技术
窥镜是现代医学中检查内脏的一种有效工具,如胃窥镜、膀胱窥镜等,它可以使医生直接看到脏器的内壁,检查是否有肿块、溃疡和出血等病变。那么心灵窥镜是否也能使研究者们看到人们脑子里的心理活动呢?对这个问题不能用是或否加以简单地回答。我们先以断层扫描技术为起点回答这个问题。对脑进行X光射线摄影,专家用肉眼进行分析,由于脑内各种软组织X光射线吸收的值相差很小,也由于脑立体结构在平面胶片上显影的重叠,就无法得到有价值的信息。它应用连续旋转,不断改变X光射线方向所得到的大量连续体层图代替单一平面图。用光电探测器和电子计算机分析处理代替人类肉眼直接分析。因此,脑断层描述装置由连续旋转的X光射线发射部分,穿过脑组织吸收后X光射线的接收和换能装置,计算分析系统等三大部分组成。X光射线放射部分,由可旋转的X光射线发射球管组成,其X光射线束宽度可调,球管每次以一度的角度可连续旋转180度,可得43200个数据。计算分析系统,由一套计算机装置构成,包括主机、输入输出卡、存储器、显示器、打印机和绘图仪等。计算机系统把接受的数据进行处理。在显示器或绘图仪上,可显示出160×160点矩阵,开成一个由25600个点组成的脑组织图像。每个点反应了1.5×1.5体层扫描厚度(毫米)的脑组织吸收X光的值。若体层扫描厚度为13 mm时,则计算机给出的25600个点中的每一个点均是0.03375 cm3脑组织吸收X光的值。通常以水对X光吸收值取作为标准值零,光吸收值每相差0.2%则为1,头骨为400~500;大脑灰质为19~23;白质为13~17;脑室系统为1~8;流动血液为6,凝血为20~30。灵敏接收器和换能系统,把各种脑组织对X光吸收差异灵敏地传递给计算机分析系统,很快地计算出结果,并在荧光屏或绘图仪上显示出各种脑结构的变化。利用人工颜色技术,把这种黑白图形转变为彩色图形,便于观察。虽然X光断层扫描技术与脑功能构像没有直接关系,由计算机控制的扫描技术却是各种脑成像技术的共同基础。无论是单光子还是正电子发射或磁共振成像,都通过脑断层扫描的基本方法得到图像数据并构成三维脑结构图像。
三、正电子发射断层扫描仪
正电子发射断层扫描仪(PET)是当今世界上最昂贵的生物医学仪器,每台造价600万~700万美元。它与其他生物医学构像技术不同,不是关于脑结构的造影,而是一种关于脑功能的造影技术,测定脑中不同区域葡萄糖的吸收率和血流量等。这种机器由放射化学装置和探测系统组成。当人们注射一种放射性半衰期只有几十分钟的18 F-D-脱氧葡萄糖之后,静静地躺在床上时,PET机器就开始了紧张的工作,脑吸收18 F-D-脱氧葡萄糖分子发射出正电子,遇到脑内的负电子,就会对撞,两败俱伤,化成一对180度反方向的强光子发射出来,这时就可以对脑不同结构进行造影。这种造影就像CT技术一样对脑进行一层层、一块块的逐一检查,对其葡萄糖吸收率进行活体动态测定。所以,利用18F-D-脱氧葡萄糖和PET机器,就可以研究人们各种认知活动时,脑区域性葡萄糖的吸收率。通过PET技术研究,脑科学家发现,人们看黑白素描时,初级视皮层葡萄糖吸收率最高,看复杂彩色风景画时,次级视皮层的葡萄糖吸收率最高;不太懂音乐的人听音乐时,右半球葡萄糖吸收率高,音乐行家听音乐时,左半球葡萄糖吸收率高;单独遮住眼睛进行视觉剥夺或单独掩起耳朵进行听觉剥夺时,葡萄糖吸收率在两侧大脑半球是对称的,但视、听觉同时被剥夺,则右半球特别是右前额叶下区和后枕区的葡萄糖吸收率下降率更为明显;一些退行性痴呆的病人,脑额区葡萄糖吸收率显著变低;一些精神分裂症病人与正常人不同,脑的葡萄糖吸收率在额叶最低,而正常人则额叶较高。这些事实说明18F-D-脱氧葡萄糖分子在脑内吸收率,不但是脑信息加工的灵敏指针,也可以作为脑疾病的诊断指标。
四、核磁共振和功能性磁共振成像
核磁共振(nuclear magnetic resonance, NMR)成像的基本理论研究工作远在1952年就得了诺贝尔物理学奖,应用核磁共振波谱仪分析化学物质的组成部分,也有40多年的历史,但是形成关于脑组织构像的核磁共振技术,应用于生物医学研究则是80年代的事情。在恒磁场中,某些物质的原子核在射频电磁波的能量激发下吸收能量,随后又发射能量的现象,就称为核磁共振现象。每种原子或离子的结构不同,受激发后出现共振的频率不同。如氢原子的核磁共振频率42.59兆赫兹,钠原子核磁共振频率仅为11.26兆赫兹。脑核磁共振的构像仪器中,射频线图(RF)可以发出1~700兆赫兹的射频电磁波,足以激发脑内化学组成中主要原子核产生的核磁共振现象。除射频线圈外,脑核磁共振构像机内还有一组恒常磁线圈引出一万高斯以上的强磁场,作为脑核磁共振的背景磁场,通常其场强为1.5T、3T等。在X、Y、Z三维方向上各有一组梯度磁场是检测脑核磁共振现象的主要部分。梯度磁场中,每一微小的变化都由计算机采集数据,构成图像显示出来。计算机采集数据和图像分析的基本原理与CT和PET机器中的原理完全相似。
磁共振成像技术自20世纪80年代,在世界各国的大医院中普遍使用,我国各地医院已有近千台机器在应用,主要用于各脏器器质性病变的诊断,当然包括脑器质病变,这种仪器不能进行脑功能成像研究,但却是功能性磁共振研究的技术基础。下面我们进一步介绍功能性磁共振成像的技术原理。
虽然功能性磁共振成像(functional magnetic resonance imaging,fMRI)原理,即回波平面成像(EPI)原理,于1977年就提出来,但直到1992年,功能性磁共振成像技术才问世。这是由于EPI要求仪器中梯度磁场的变化梯度0.2 mT/m,而且上升时间不得慢于100 ms,这在技术上难度很大。此外,功能性磁共振成像中采样率要求不得少于500 kHz,只有这样才能在短于100 ms射频脉冲期对磁共振数据采样K空间给出足够快的扫描。最后,普通磁共振成像仪器的信噪比也满足不了功能磁共振快速成像的要求。因为随着成像速度快,噪声成比例增加,磁共振仪的这些条件满足之后还要有较好的计算方法和软件,才能对快速成像的数据进行处理。由于软、硬件条件的上述改进,使传统磁共振成像从约60 s才能出一幅清晰图像,改变为每0.1 s可给出较好图像。除仪器条件的这些特点还有多种不同EPI方法,用于不同目的,如水扩散成像法适于得到脑灰质和白质分布的精细变化,而灌注成像法适于得到局部血容量的测定。一般采用梯度快速成像法可灵敏测定含氧血红蛋白的分布状态,以此作为脑功能的灵敏指标,适用于认知神经科学和精神病研究,也就是通常所讲的磁共振认知成像技术。