脑功能成像及在人文社会科学中的应用
上QQ阅读APP看书,第一时间看更新

1.4 任务态fMRI

1.4.1 fMRI硬件条件

功能磁共振成像得到的是随时间变化的信号,因此对磁共振硬件有较高要求。磁共振成像系统要有足够的稳定性,从而保证功能磁共振信号的可靠性。关于磁共振稳定性的评价和质量控制将在1.6节详细讨论。

功能磁共振成像对磁场强度有一定的要求,由1.1节论述可知,磁场强度越大,由BOLD效应产生的磁共振信号变化也越大,这种变化也越容易被磁共振系统检测到。功能磁共振成像从最早在1.5T系统上开展,到现在的3T、7T甚至9.4T,磁场强度越高则设备的灵敏度越高,单个体素的信噪比也越高。在保持相同信噪比的情况下,高场强磁共振系统可以得到更高的空间分辨率,检测到更精细的大脑激活区。目前,3T磁共振成像系统是脑功能成像研究的主流设备。

功能磁共振成像除了对磁共振成像仪有较高要求外,对接收线圈也有较高要求。这是因为在磁场强度一定的情况下,使用多通道相控阵接收线圈可以提高图像的信噪比。由于多通道相控阵接收线圈由多个小的表面线圈构成,磁共振图像的信噪比与表面线圈的位置及其直径有关,成像物体与表面线圈越近,信噪比越高,表面线圈半径越小,则接收信号的穿透能力越弱。所以接收线圈通道数越多,则越靠近线圈的位置信噪比越高,越靠近线圈中心的位置信噪比越差。在功能磁共振图像上表现为皮层处图像较亮,大脑中心处图像较暗(见图1.7)。由于功能磁共振成像主要关注的是脑皮层,所以通道数越多的头线圈可以得到更高的信噪比。如前所述,功能磁共振成像得到的是随时间变化的信号,因此功能像上图像强度的不均匀性不会影响实验结果。目前,功能磁共振成像常用的接收线圈有8通道、12通道、20通道、32通道和64通道头线圈,除此之外还有光纤接口的头线圈。如果磁共振成像仪配有多个头线圈,则在进行功能磁共振成像研究时推荐优先选择通道数多的头线圈。但通道数多的头线圈也有一定的局限性,如空间小。大多数的脑功能实验是视觉或听觉刺激,需要被试配戴校正眼镜或磁兼容耳机,被试的头如果太大将不适用(头戴不进线圈),因此需要权衡。还需要注意的一点是,同一研究项目请尽量使用同一种头线圈,以最大限度地减小实验条件对结果的影响。

图1.7 20通道头线圈和64通道头线圈采集图像对比

注:(A)为20通道头线圈采集图像;(B)为64通道头线圈采集图像。

功能磁共振成像研究还常常借助于视听觉刺激系统,即一种能够给躺在磁共振仪内的被试观看视频、听声音,同时还能够给出被试反馈的专用装置。由于磁共振环境的特殊性,该套装置必须是完全磁兼容的,即能够在强磁场下正常工作,不受强磁场的影响,并且工作时不能对磁共振图像产生干扰。视听觉刺激系统通常由显示单元(可以是投影或液晶显示器)、音频系统、行为反馈单元、硬件控制单元、同步触发单元、计算机及专用程序等部分构成,各单元通过光纤或特殊处理过的线路进行连接。视听觉刺激仪的工作示意如图1.8所示。根据刺激任务的不同,功能磁共振成像研究可能还会用到磁兼容痛觉仪、嗅觉仪、触觉仪等。此外,为了得到被试完成刺激任务时的其他生理信息,可能还会用到其他的一些外围设备,如磁兼容眼动仪、磁兼容脑电仪、磁兼容生理信息记录仪等。由于篇幅关系,这里不予详述。

图1.8 功能磁共振成像使用的视听觉刺激仪

1.4.2 任务态fMRI常用实验设计模式

组块式实验设计:组块式实验设计把大脑分成两种状态,一种是大脑实现某种脑功能时的状态(“on”),另外一种是大脑没有这个功能刺激时的状态(“off”)。而一次采集需要重复若干次(几次到几十次)的“on”和“off”信号,然后把所有“on”状态采集的数据相加、减掉,作为本底的“off”信号。由于噪声是随机的,与“off”信号相加时,噪声不会增加,而与“on”信号相加时,和事件相关的信号可以按照线性关系叠加在一起,从而达到提高信噪比的目的。图1.9(A)是用组块式方法实现数据采集时时间序列和信号的响应关系。组块式BOLD-fMRI实验设计可以分成三步:(1)研究人员可以把感兴趣的大脑某种功能设计成对大脑的某种刺激,构成实验的一个事件,把实验分解为有该事件和没有该事件的两种状态;(2)这个事件应该满足减法法则,即可以把这种脑功能从各种混合的脑功能信息或者非脑功能的信息中通过相减的方式分出来;(3)重复执行步骤(1)和步骤(2)。“on”和“off”持续时间一般相同,为20~30秒。

为了实现上述过程,需要做两个假设。其一是相减性假设,例如当我们从事面孔识别的认知研究时,通过让被试从屏幕上观看熟悉或者不熟悉的面孔作为刺激过程的“任务”和“控制”两种刺激状态,对应于前面提到的大脑“激活”和“静息”两种状态,在时间序列上成像。相减性假设表明,感兴趣的事件可以从“任务”—“控制”的平均信号中得到。从生理学的角度看,从这里得到的信号必须是相应的神经元簇活动引起的,在这个例子中就是被试对熟悉面孔的大脑刺激。其二是纯插入假设,该假设认为一个认知过程可以叠加到已经存在的序列认知过程中,而不影响这个序列认知过程。证明第二个假设是困难的,困难之处在于到底如何证明对原来已经存在的认知过程是否有影响,这和如何设置“有任务”或者“没有任务”这两种情况有关。需要在心理和神经科学两个层面上有足够的证据证明“有任务”或者“没有任务”的设置是正确的。

图1.9 组块式实验设计和事件相关实验设计

事件相关实验设计:单次刺激BOLD-fMRI实验测量可以在连续对被试实施采集的同时,连续地采集和刺激相关的数据,所以常常被称为事件相关的磁共振功能成像(event-related fMRI)。采用这个方法的目的是可以独立地观测大脑被激活时引起的fMRI信号的改变。事件相关实验设计可以分为慢速事件相关实验设计和快速事件相关实验设计。慢速事件相关实验设计如图1.9 (B)所示,图中的一个脉冲表示一次刺激。根据血流动力学响应可知,该刺激引起的血流血氧变化需要30秒左右的时间才能完全恢复,血流血氧完全恢复后才能进行下一个刺激。可见,这种实验设计的效率是非常低的,一分钟只能有两次刺激。而在fMRI中,一种条件通常需要20~30次的重复刺激,如果采用这种慢速事件相关实验设计,则需要非常长的扫描时间,故目前很少有人采用这种方式的实验设计。快速事件相关实验设计针对慢速事件相关实验设计的弊端进行了改进,两次刺激之间的时间间隔不是固定的30秒,而是采用随机时间长度,称为刺激间隔(ISI)。刺激间隔常用的是2秒、4秒、6秒、8秒或10秒,出现的频率可以相同也可以不同。这样,平均每次的刺激时间会明显缩短,既提高了实验效率,同时也能很好地激活大脑。目前的事件相关实验设计通常都采用这种快速事件相关实验设计,见图1.9(C)。

混合实验设计:除了上面提到的组块式实验设计和事件相关实验设计,还有一种将两者结合在一起的实验设计方式,称为混合实验设计。混合实验设计模式如图1.10所示。它整体来看是组块式实验设计,而每个刺激组块又是由快速事件相关实验设计构成的,比如心理学中经典的工作记忆N-Back任务就可以采用这种设计方式。假如有0-Back、1-Back和2-Back三种条件,每个Back条件下呈现的字母或数字采用快速事件相关方式呈现,同一种条件持续一段时间,如30秒,接下来是一段时间的静息作为基线,其余两个条件依次呈现。混合实验设计既可以得到组块式实验设计的激活效率,又可以得到事件相关实验设计的各种反馈,因此它在实验设计中也是经常采用的方式。

图1.10 混合实验设计模式

1.4.3 fMRI数据分析

fMRI数据分析分为基于个体的数据分析和基于组的数据分析,基于个体的数据分析又分为数据预处理和统计分析两部分,本节内容将分别予以介绍。

1.4.3.1 fMRI数据预处理

在对个体的fMRI数据进行统计分析之前,首先要做预处理,对原始数据进行必要的加工,以尽可能地去除所有与BOLD信号不相关的干扰因素。个体fMRI数据预处理分为层间时间校正、头动校正、空间标准化和空间平滑四部分(Talalrach and Tournoux,1988; Parrish et al., 2000; Della-Magglore and Chau, 2002; Jezzard et al., 2003)。其中,头动校正和空间标准化属于图像配准范畴。

层间时间校正:通常,fMRI实验都是在采样时间(TR)为1~3秒内采集多层图像以覆盖整个大脑,每层图像的采集时间相同。采集方式可以是顺序采集,从头顶到小脑下缘或从小脑下缘到头顶依次进行采集,也可以是隔层采集,先采奇数层再采偶数层或先采偶数层再采奇数层。至于具体的采集顺序,每个磁共振厂家都有自己的定义。比如西门子的隔层采集顺序是由总采集层数的奇偶性来决定的,如果总采集层数为奇数层,则先采集奇数层再采集偶数层,反之则先采集偶数层再采集奇数层。如总采集层数为33层,则采集顺序是1,3,5, …,33,2,4,6, …,32;而采集层数为32层时,则采集顺序是2,4,6, …,32,1,3,5, …,31。隔层采集的目的是降低相邻层间信号的相互影响。以西门子采集33层为例,设TR=2秒,则第一层在0时刻开始采集,而第二层却在之后的1秒开始采集,所以我们得到的第二层图像的血流动力学响应比第一层延迟了1秒。这会严重影响数据分析的准确性,其对事件相关型实验的影响尤为严重,如图1.11所示。层间时间校正的目的是通过插值运算使所有层面的信号等同于在同一时间采集。插值运算一般是先选择采集时间中点的一层作为参考层,然后对其他每层图像,进行邻近时间点的数据插值(线性插值或正余弦插值)运算,从而使对于每个TR,插值后每层图像的信号采集时间点与参考层的时间点一致。

图1.11 由于采集时间不同而造成的不同层面的血流动力学效应也不同

注:左上图红色区域为我们感兴趣的脑区;右上图为图像采集方式,先采集奇数层再采集偶数层;由于采集时间的差异,导致不同层图像在同一个TR内,血流动力学响应存在时间差异(见左下图);右下图为不同TR内得到的各层血流动力学响应曲线。由于采集时间的差异,16层比15层和17层更早达到响应峰值。

头动校正:头动在fMRI实验中是很常见的现象,因为fMRI实验时间一般较长(几分钟到几十分钟),被试在这么长的时间内很难保持一动不动。而头动会严重影响数据分析的结果,产生一些假阳性结果,也会使一些真正的激活无法被检测到。这是因为在fMRI数据中,每个体素都代表固定的成分,而对于头动数据,每个体素代表的成分在不同时间是不一致的,如图1.12所示。这就会导致假阳性,即该脑区并没有被激活,但由于头动体素内成分的改变,从而导致体素信号随时间发生了变化。通常,在扫描前要明确告知被试保持头部不动,并加辅助固定装置,如海绵垫或真空垫等。

图1.12 头动对fMRI数据的影响

注:红框内为列举的体素,右下图为头动前感兴趣的体素成分,右上图为头动后该体素的成分。可以看出头动前后同一体素的成分是不同的,同一体素测量的信号值也不同,这可能会导致假的信号激活。

我们粗略假设头部是一个刚体,即施加外力后形状不发生改变的物体。对于刚体变换,物理上需要六个参数来描述,三个描述平移,三个描述转动。头动校正一般分为两步:(a)确定待配准图像和参考图像之间合适的数学变换模型以及在该变换模型下的匹配目标函数,然后在参数空间中进行搜索,以得到满足目标函数的参数;(b)按照这些参数将源图像进行变换,这样就得到头动校正后的图像。参考图像通常是该次扫描的第一幅图像或者该次扫描的平均图像。

空间标准化:每个人的大脑大小和形状都是不同的,中国成年人的大脑体积(脑实质)为821.05~1546.25cm3,平均大小在1199.07±103.53cm3(数据来自北京大学磁共振成像研究中心1212人大数据分析,年龄18~40岁,男女比例1∶1)。为了能够进行组间比较,我们通常需要把所有被试的大脑配准到同一个标准人脑空间,目前最常用的标准人脑空间是蒙特利尔研究所的MNI152空间。空间标准化问题涉及如何把个体脑映射到标准空间,从而使个体脑中的任一体素与标准脑空间坐标存在一一对应的关系,这样每个个体的脑变换到标准空间后,不同个体间就可以进行统计分析。

空间变换可分为基于标记和基于非标记两类。基于标记的技术需要识别图像和模板中的对应特征(标记)并找到这种变换以把它们叠加得更好。标记可以是点、线或面。对应特征经常是手动识别,并且很花时间,也带有主观性。用点或线做标记是因为在脑中几乎没有什么可识别的分立点或线,但表面却很容易被识别出来,在很多情况下,甚至能自动(至少半自动)提取。表面一旦被识别出来,空间变换就可以有效地把对应标记重合在一起。用基于非标记的方法来鉴别一个空间变换,可以使目标图像和模板图像之差的相关指数最小化。配准判据通常基于最小化其方差和,或者最大化其相关系数。基于非标记的空间变换有许多方法。描述调整两个图像在一起的非线性变换需要很多参数(高维问题),众多空间变换形式的差别在于如何处理这些大量的参数。如黏滞流体模型用有限元法解偏微分方程,而偏微分方程模拟一个像,就像它流到另一个同样形状的像中。这个方法的主要优点是它能考虑到很大的非线性位移,并能保证这些扭曲像的拓扑结构被保留下来,其缺点是计算量很大。多分辨率方法一次只能确定几个参数,通常在整个体积内描写全局低频畸变参数,然后把它分割成各子体积求出稍高频率的畸变。还有一个常用的方法是减少模拟畸变的参数数目,考虑位置、取向和整个脑尺寸的差别,用9个或12个参数仿射变换进行空间标准化。这个方法用低频基函数线性组合描写畸变对头形的低空间频率全局变量,小数目参数不能使每个特征都得到精确匹配,但它可使全头形都得到模拟。

图像平滑:图像平滑包括时间域平滑(temporal filtering)和空间域平滑(spatial filtering),其目的都是去除不感兴趣的频率成分。

时间域平滑首先将fMRI时间域的数据通过傅里叶变换转化为频率域信息,在频率域内选择不同的滤波器,衰减不感兴趣的频率成分,然后再将频率域数据通过反傅里叶变换转化为时间域信息。这里我们介绍时间域平滑如何改善图像质量,提高信噪比(SNR)。我们希望保留和任务有关的频率成分,而去除或最小化其他频率,如生理噪声的频率。根据先验知识,人平均每4秒呼吸一次,相当于频率为0.25Hz。在fMRI数据分析中,相对于神经元活动,呼吸带来的信号是噪声,需要排除。如果实验任务的频率和呼吸频率相差较大,则可以用时间域滤波来消除频率在0.25Hz左右的成分,而其他频率成分可以保留,这种滤波器称为带通滤波器。类似地,如果噪声频率较高,频带很宽,且大于感兴趣成分频率,则可以在时间域选择低通滤波器,滤除高频的噪声成分;如果噪声频率较低,频带较宽,且低于感兴趣频率,则可以在时间域用高通滤波器,滤除低频噪声成分。但是,当噪声频率和感兴趣成分频率相近时,简单的时间域滤波不能达到滤除噪声、提高信噪比的目的。

空间域平滑一般采用低通滤波器来去除高频噪声信号,对fMRI数据处理有很重要的影响。空间滤波将附近体素的信号强度进行加权平均,以得到平滑的图像。最常用的空间滤波器是高斯滤波器,图像平滑的程度用高斯滤波器的半高宽(full-width half maximum, FWHM)来表示。高斯平滑核半高宽越大,图像越平滑,fMRI数据处理一般选择的半高宽为2~3个体素大小。当选择的高斯滤波器的半高宽与图像激活区域大小相同时,可以显著提高图像的信噪比。这是因为功能区域内的所有体素,在神经激活时都有较高的强度,而噪声的分布很离散,所以当进行适当的平滑时,噪声的信号会被平均掉,获得较高的信噪比。另外,由于噪声会被平滑掉,这样做也可以降低假阳性率。空间域平滑也可以用于多个被试的比较,因为不同被试大脑的大小和形状差别较大,同一个功能脑区在不同的被试中会出现在不同的体素位置,所以可以通过对多个被试的数据进行体素间的空间域平滑来得到一幅平均的激活图像。空间域平滑也有很大的局限性,例如当选用的半高宽过大而激活区域较小时,平滑就会使信噪比降低。大量的研究也表明,空间域平滑会模糊空间信息,降低空间特异性。因此,是否应用空间域平滑,如何选取滤波器的半高宽,要根据实际情况而定(Nieto-Castanon et al., 2003; Thirion et al., 2006)。

1.4.3.2 fMRI数据统计分析

目前常用的磁共振数据分析方法可以分为参数模型和非参数模型两类。其中依赖于随机场分布的统计分析是最常用的参数模型,也是目前fMRI数据分析最流行的方法。置换检验方法(permutation test)是典型的非参数模型统计方法。

那么,什么是统计分析呢?在数据分析中,我们经常要判断一组数据的均值是否显著大于0,或者两组数据的均值是否显著不同,如图1.13所示。统计分析就旨在解决这种问题。

图1.13 典型的数据分析

在统计分析中,我们通常会做出零假设(null hypothesis),假设要检验的结果没有显著差别,即H0:U=0或H0:U1=U2。然后,我们利用统计分析来判断是否接受这一假设。

一般线性模型:对于fMRI数据,一般线性模型(General Linear Model, GLM)常被用来做统计检验(Friston et al., 1995)。一般线性模型的表达式为

其中:i表示体素的坐标(x, y, z); Y为体素i的观测强度值;X是实验设计矩阵;β是相应实验条件的估计参数;ε表示残差,如图1.14所示。我们通常假设残差的均值为0,方差为常数,即E(εi)=0, βi的无偏估计值,则残差可表示为

通过这个方差我们可以得出其中η为误差的自由度。因此,对于给定的常数c,统计检验值可表示为

图1.14 一般线性模型

注:Y为体素的观测强度值,X是实验设计矩阵,β是相应实验条件的估计参数,ε表示残差。

统计显著性通常被用于判断是否拒绝零假设,我们通常将统计显著性p的域值设为0.05。当体素的强度值对应的p值小于0.05时,原假设通常被拒绝,我们认为这是显著激活体素;否则,接受原假设,认为这个体素是不激活的。在统计检验中,通常会有四种结果,如图1.15所示。即当原假设正确时,如果我们拒绝了这个假设,则结果为假阳性,如果接受原假设,则结果为真负值;当原假设不正确时,如果我们拒绝这个假设,则结果为真正值,如果接受原假设,则结果为假负值。我们通过定义灵敏度来表示真正值的检测率,通过定义特异性来表示假阳性的控制率。

多重比较校正:早期的功能磁共振成像数据分析依赖于简单的t检验方法(Kwong et al.,1992),这一方法应用于功能磁共振数据是极不严格的,会导致数据检验结果的灵敏度和特异性都显著降低,造成检测结果中假阳性比例过高(统计中的第一类错误)。因为对于t检验,当统计显著性控制为5%时,每个体素被检测为激活体素的概率为0.05。这样,如果图像总共有5000个体素,那么被检测为激活的体素约为250个,即使没有真正的激活体素存在。而在统计检验中,我们主要是控制第一类错误的发生比例。因此,基于t检验的多重比较校正方法得以提出,误差率判断(family-wise error rate, FWER)是用来控制假阳性的标准多重比较方法,FWER是指存在一个或多个假阳性。如果FWER校正的p值为0.05,则可以说在整个图像中,没有FWER的概率为95%。

图1.15 统计检验结果

邦弗罗尼(Bonferroni)校正:邦弗罗尼校正是典型的FWER校正方法(图1.16说明了邦弗罗尼校正方法和t检验方法之间的关系),在邦弗罗尼校正中每个体素被检测为激活体素的概率为FWER校正的概率(0.05)除以所有体素的数目。例如,如果有10000个体素,则每个体素的统计显著值为0.000005。显然,这一方法成功地控制了第一类错误的发生,保证了统计检验的特异性。然而,邦弗罗尼校正的阈值依赖于体素的数目,对于每幅fMRI图像,体素的数目可以达到几万至几十万,因此邦弗朗尼校正的阈值太大,在减少假阳性概率出现的同时,又极大地降低了真实信号的检测效果,导致统计检验太严格,灵敏度下降,尤其不适用于激活强度不高的fMRI图像。这是因为该方法假设每个体素都是独立的,而对于大多数fMRI数据,体素都是空间相关的。

图1.16 邦弗罗尼校正和t检验之间的区别

随机场理论的FWER校正:随机场理论(random field theory, RFT)是目前最常用的FWER校正方法。基于随机场理论的FWER校正利用了数据平滑度这一特性,所以对于大部分fMRI数据,其有更好的有效性。下面我们简单介绍一下基于随机场理论的FWER校正方法:体素水平(voxel level)的FWER校正(Worsley et al., 1996; Cao, 1999)和团簇水平(cluster level)的FWER校正(Friston et al., 1994; Li et al., 2014,2015)。体素水平统计方法仅仅通过控制信号的激活强度来检测激活体素。团簇水平统计方法通过控制信号激活(或变化)强度和激活区域大小来检测显著激活脑区,只有在信号变化程度超过一定强度,并且变化空间足够大的区域,才能被检测为显著激活信号,零散分布的高强度体素会被认为是噪声而排除掉。

1992年,沃斯利(Worsley)等人首次从理论上提出了基于自由场理论的体素检验方法,该方法首次从理论上系统地提出了基于随机场理论的体素水平FWER校正方法(voxel-level FWER,并给出了精确的理论模型,其统计检验的灵敏度显著优于上述邦弗罗尼校正方法,从而为目前磁共振数据统计方法的发展和优化提供了理论基础(Worsley et al., 1992)。但沃斯利等人的方法仍然不是最适用于功能磁共振成像数据的检验方法,原因如下:众所周知,大脑神经元活动是以团簇的方式进行的,每个团簇至少有几百mm3功能磁共振成像数据的小约为3mm×3mm×3mm,所以每个团簇的体素数目远远大于1个。噪声是随机分布的,很多噪声聚在一起形成团簇的概率极低。因此利用大脑激活信号有形成团簇的趋势和噪声没有形成团簇的趋势这一特点,可以从激活团簇空间大小方面为分析fMRI数据提供新的手段。沃斯利等人的方法检验出来的激活结果中,并未考虑到神经元活动的特点,所有超过强度阈值的体素都被认为是激活点,这就导致了假阳性的增加。

针对这一问题,弗理斯顿(Friston)等人在1994年提出了基于自由场理论的团簇检验方法(Friston et al., 1994)。该方法的统计显著性,即FWER正的p值,由强度阈值t和团簇大小k共同决定,通常选择的p值为0.05。该方法的示意如图1.17所示,首先在得到的t统计参数图,找出阈值大于t的所有体素,然后通过连通性,将超过阈值的所有体素分为不同的团簇,找出给定显著统计性下团簇大小大于k的所有团簇。这一方法结合了神经元活动的特点,当神经元活动的团簇强度较大而体素数目较少时,可以选择小k值,大t值;当神经元活动的团簇强度较小而体素数目较多时,可以选择大k值,小t值。因此,该方法的灵活性较大,是目前最常用于功能磁共振数据的统计分析方法之一。

图1.17 团簇校正流程

但该方法理论模型的建立是为了分析正电子发射型计算机断层显像(PET)数据,需建立在高空间平滑假设和空间平滑均匀性的基础上,即仅适用于分析高空间平滑和空间平滑均匀的图像。对图像高空间平滑和空间平滑均匀的说明分别如图1.18和图1.19所示。高空间平滑会严重降低图像的空间分辨率,尤其不适应现在先进科学研究的要求和临床诊断的要求(Nieto-Castanon et al., 2003; Thirion et al., 2006)。1995年,不依赖于空间平滑的团簇校正方法得以提出,该方法可应用于不平滑或低平滑的磁共振数据检验(Xiong et al., 1995)。但该方法只是部分解决了弗理斯顿方法的限制,因为该方法只适用于分析二维数据。目前磁共振成像采集的数据一般都是多层或三维数据,因此该方法并不能真正解决磁共振数据分析受限于高平滑的问题。为了解决这一问题,Li等人提出了基于体素校正的三维团簇检验方法,该方法不再依赖于高空间平滑假设,在低平滑情况下仍可以保证较高的灵敏度和特异性,尤其适用于分析fMRI个体数据(Li et al., 2014)。

图1.18 未平滑和平滑过图像的对比

图1.19 平滑不均匀图像及其团簇特征

空间平滑均匀性的要求,使得弗理斯顿方法不适用于空间平滑不均匀的数据分析,而平滑不均匀现象在组间磁共振成像数据分析中是普遍存在的。这是由于组间分析必须将所有被试的图像都配准到标准空间,而不同被试的脑图像大小并不一致,在配准过程中不同脑区会进行不同程度的形变(即拉伸压缩),进而导致不同脑区的平滑程度不同。如果空间平滑是不均匀的,那么在平滑较大区域随机产生的团簇就会比在平滑较低区域产生的团簇大。用传统随机场理论团簇检验模型分析平滑不均匀数据时,会导致高平滑区域的团簇容易通过统计检验,从而提高高平滑区的假正值率;而低平滑区域的团簇难以通过统计检验,从而降低真正激活团簇的检测概率(Ashburner and Friston, 2000; Hayasaka et al., 2004; Silver et al., 2011)。

沃斯利等人在1999年用每个体素的平滑度定义团簇大小,提出了适用于平滑不均匀图像的团簇检验方法(Worsley et al., 1999, 2002)。大量的实验表明,该方法只适用于分析空间平滑程度较大和自由度较高情况下的数据,当空间平滑程度较小或者自由度较低时,检测灵敏度会显著降低(Hayasaka et al., 2004)。针对上述问题,不依赖于高空间平滑、高自由度和高强度阈值,同时可用于分析空间平滑不均匀三维磁共振成像数据的团簇检验方法在2015年得以提出,该方法尤其适用于分析组间磁共振成像数据(Li et al., 2015)。

错误发现率(false discovery rate, FDR)校正:除了用FWER校正来控制假阳性之外,也常用FDR校正来控制假阳性(Genovese et al., 2002;Chumbley and Friston, 2009)。相比于FWER校正,FDR校正是比较宽松的方法,它控制的是假阳性在所有检查结果中所占的比例。例如,通过p=0.05的FDR校正,如果检测到激活的体素为2000个,那么假阳性的个数约为0.05×2000=100个。图1.20展示了FWER校正和FDR校正的不同之处。

置换检验(permutation test):除了基于随机场理论的FWER校正方法,非参数的方法最近也常用来分析fMRI数据。置换检验是最常用的非参数检验方法,和随机场理论方法不同的是,置换检验不需要假设数据的分布,而是根据数据本身的分布来做统计检验,找到相关的p值(Holmes et al., 1996;Nichols and Holmes, 2002)。图1.21展示了A、B两组数据的置换检验示意。要检验A组数据和B组数据是否有显著差异,我们对这两组数据进行20次随机置换排列,每次置换后用前三个数据作为一组和后三个数据做t检验,得到一个t值。所有置换结束后,就得到了20次置换的t分布值。然后用A组数据和B组数据t检验后的t值作为阈值tc,计算置换检验得到的分布中大于阈值tc的面积占总面积的比例。置换的次数为(n1+n2)! /(n1!n2! ),其中n1为A组的数据数目,n2为B组的数据数目。

图1.20 FDR校正和FWER校正的不同结果

注:统计显著性为10%。红色圆圈内为激活体素,圆圈外为噪声点。第一行为未校正的t检验结果,该方法可以检测到大部分激活体素,但是假正值的数目也很多,约为所有未激活体素的10%。FDR校正的结果,假正值的控制效果好于不校正的方法,对于每个检测结果,约10%的检测结果为假正值。FEWR是控制假正值最好的方法,在10个检测中只有1个结果出现了假正值。

虽然置换检验不依赖于数据的分布假设,但是它必须满足数据可以随意交换的特点,这对于单个被试的数据分析是一个挑战。因为对于一个人的fMRI数据,其数据是有时间相关性的,不能随意交换,不满足置换检验的要求,所以置换检验对于个体fMRI数据和重复测量的fMRI数据是不适用的,它只适用于组间分析。基于置换检验,牛津大学的史密斯(Smith)和尼克尔斯(Nichols)等人在2009年提出了不依赖于强度阈值的团簇加强的检验方法(TFCE),该方法不同于团簇检验方法,其得到的结果不依赖于强度阈值的选择(Smith and Nichols, 2009)。

感兴趣区域(regions of interest, ROI)分析:通常情况下,fMRI数据处理都建立在以全脑体素为分析对象的基础上,但有些时候人们想研究的是大脑的哪些区域对特定的任务敏感,于是提出了ROI分析方法,即只对感兴趣的特定脑区进行分析(Jha & McCarthy, 2000)。这种分析方法首先要选择一个或多个目标脑区,具体的选择方法大致有两种:其一是依靠先验知识在结构像上确定ROI,再通过配准在功能像上找到要研究的脑区;其二是先进行一次功能定位扫描,经过统计分析确定被激活的区域,并据此直接在功能像上选择ROI。通常认为所选择的某一ROI只对应特定的功能,不可再进行功能分割。然后对一个ROI内的所有信号进行平均,将一个ROI看成一个整体来分析其时间过程。

图1.21 A、B两组数据的置换检验示意

感兴趣区域分析的优势在于:首先,ROI的数目远远小于体素的数目,这大大减少了统计检验时的多重比较校正,改善了多重比较校正过于严格的状况;其次,由于每个ROI的信号是对具有相同功能的体素信号的平均,因此其信噪比(SNR)得到了很大的提高;最后,ROI分析更有利于进行多个被试之间的比较,因为ROI分析比较的是与特定功能有关的脑区,讨论的是这个脑区的响应情况,不需要将被试的全脑图像配准到标准空间,从而避免了空间标准化使功能区形变所带来的被试间误差。

ROI分析也有其局限性,根据经验选择ROI时,很难保证选定的ROI只对同一任务有响应,即某一ROI可能对应多重功能。对于特定的任务, ROI内的体素可能只有一部分被激活,这样反而会导致SNR降低。通过功能定位确定激活区域作为ROI,可以在一定程度上减轻此类问题的影响。目前ROI分析并没有被广泛接受,因为不同被试的脑结构差异很大,依靠经验会带来较大误差。不过可以结合ROI分析和体素分析,即先用ROI分析来确定哪些区域被激活,再用体素分析来精确确定ROI内的哪些体素是真的被激活,具体的分析方法应结合实验设计来确定。

1.4.3.3 常用的fMRI数据处理软件

目前,fMRI常用的数据处理软件有SPM(www.fil.ion.ucl.ac.uk/spm)、FSL(www.fmrib.ox.ac.uk/fsl)、Brain Voyager(www.brainvoyager.com)和AFNI(http://afni.nimh.nih.govafni)等。SPM的全称是统计参数图(statistical parametric mapping),是英国伦敦大学学院(University College London)基于Matlab开发的一套fMRI、PET以及EEG数据处理的免费软件包,目前最新版本是SPM12。该软件包可以在Windows、Linux、Unix、Mac OSX等多种操作系统下运行,软件可以在图形界面下运行,也可以编写批处理文件运行。FSL是英国牛津大学脑功能磁共振成像(fMRIB)中心开发的用于处理fMRI、MRI和DTI数据的免费软件,目前最新版本是V5.0。该软件运行于Linux和Mac OSX操作系统,可以以图形界面方式或命令行方式运行。Brain Voyager是著名的fMRI数据处理商业软件,除了处理fMRI数据还可以处理EEG和脑磁图(MEG)数据,目前最新版本是QX 2.8.4。该软件可以运行于Windows、Linux、Mac OSX等多种主流操作系统,该软件使用C++编程,运行速度快,同时支持并行计算,界面友好。AFNI是美国国家卫生研究院开发的一款专用于处理fMRI数据的免费软件,该软件可运行于SGI、Solaris、Linux和Mac OSX操作系统。该软件使用C语言编程,运行速度快,同时具备图形界面和命令行运行方式。这几种软件的处理流程略有不同,但都是被国际认可的软件,可以根据需要和使用习惯进行选择。

除了以上常用fMRI分析软件外,还有一些辅助软件也会经常用到。MRIcron(http://www.mccauslandcenter.sc.edu/mricro/mricron/)是一款NIFTI图像查看分析软件,功能强大,其中包括的“dcm2niigui”工具可以方便地将DICOM文件快速转换为各种格式的NIFTI文件,该软件也可以运行于多个操作系统。xj View(http://www.alivelearn.net/xjview8/)是一款用来查看SPM软件处理结果的软件,它使用Matlab开发,可运行于多种操作系统。相比于SPM自带的结果查看功能,该软件可以生成多种形式的结果图,自动生成激活区报表并给出各激活区的解剖名称。该软件还可以把激活区保存为MASK文件。