上QQ阅读APP看书,第一时间看更新
第一节 交互作用的定义
用 A和 B两个变量分别代表两个研究因素,这里我们假设这两个因素都是二分类的。当变量取值为0时表示相应因素不存在,而取值为1时表示相应因素存在。令 R 11、 R 10、 R 01、 R 00分别表示( A=1, B=1)、( A=1, B=0)、( A=0, B=1)及( A=0, B=0)四种组合下的风险(如发病率、患病率、OR、RR等),见表5-1。
表5-1 A、B各种组合下对应的风险
一、相加效应模型
以差值反映效应强度(如率差),若下式成立,
即 A、 B两因素同时作用的效应强度不等于 A因素单独作用的效应强度与 B因素单独作用的效应强度之和,则称 A、 B两因素间有相加效应的交互作用。若
R11-R00>R10-R00+R01-R00
即 A和 B同时作用的效应强度大于两者单独作用时的效应强度之和,称为协同作用(synergism),或超可加性(super-additive)。而若
R11-R00<R10-R00+R01-R00
即 A和 B同时存在的效应强度小于两者单独作用时的效应强度之和,称为拮抗作用(antagonism),或次可加性(sub-additive)。
对等式(1)进行变换,可得
R01-R00≠R11-R10
故交互作用也可理解为: A因素的存在改变了 B因素的效应。
二、相乘效应模型
若以比值(如率比、比数比等)反映效应强度,若
即 A和 B两因素同时作用的效应强度不等于 A因素单独作用的效应强度与 B因素单独作用的效应强度之积,则称 A和 B间有相乘效应的交互作用。当上式中的不等号为大于号时,称为超相乘性(super-multiplicative);为小于号时,称为次相乘性(sub-multiplicative)。
例1 rs2895680位于5号染色体长臂。Dong等人在2012年Natural Genetics杂志上发表的研究结果表明,rs2895680的T->C突变及吸烟间的交互作用与肺癌的遗传易感性有关。数据见表5-2,表中分组取值为1~6,分别代表吸烟状况与基因多态性的6种组合。
表5-2 肺癌的遗传易感性与rs2895680及吸烟的关联性
由于该资料来自于病例对照研究,故这里采用优势比(odds ratio,OR)作为效应尺度。若以TT基因型的个体为对比组,对于从未吸烟者,
OR 2/1=1791×3131/(1729×2687)= 1. 21
OR 3/1=509×3131/(1729×534)= 1. 73
对于曾经吸烟者,
OR 5/4=2382×2206/(2777×1542)= 1. 23
OR 6/4=520×2206/(2777×444)= 0. 93
由结果可知,是否吸烟这一因素改变了rs2895680的效应。对于从未吸烟者,与TT基因型相比,CC基因型增加了肺癌的遗传易感性( OR 3/1= 1. 73);而对于吸烟者,CC基因型的效应非常微弱( OR 6/4=0. 93)。若这种不一致有统计学意义,则可以说吸烟和rs2895680间存在着交互作用。
不难得到,
OR6/1<OR3/1OR4/1
即,与不吸烟的TT基因型携带者相比,吸烟的CC基因型携带者患病的比数比,小于吸烟的TT基因型携带者患病的比数比与不吸烟的CC基因型携带者患病的比数比之乘积,即在相乘模型假设下,吸烟和rs2895680可能存在着次相乘型交互作用。又
OR6/1-1<OR3/1-1+OR4/1-1
吸烟和rs2895680间也可能存在着拮抗型的相加交互作用。
有时候,采用相加模型和相乘模型,对交互作用的识别有非常大的影响。例如,对于同一资料,没有相加效应的交互作用并不意味着没有相乘效应的交互作用,反之亦然。
例2 利用病例对照设计来研究某基因、吸烟与肺癌遗传易感性的关系。基因与吸烟两因素各组合下的 OR见表5-3。
表5-3 吸烟和石棉暴露与肺癌发病率(/10万人年)的模拟数据
若采用相乘效应模型,得
OR11/OR00=3/1=(OR10/OR00)×(OR01/OR00)=(2/1)×(1. 5/1)
则吸烟与是否携带易感等位基因之间不存在相乘交互作用。
而若采用相加效应模型,得
OR11-OR00=3-1>(OR10-OR00)+(OR01-OR00)= 2-1+1. 5-1=1. 5
则吸烟与否携带易感等位基因之间可能存在相加交互作用。当然,除了估计交互作用的强度外,还需要通过假设检验来确认交互作用的统计学意义。
此外,不同的效应指标,也会对交互作用的评价带来影响。如果疾病危险度在研究变量各个水平都不低,那么对于一个效应指标没有统计学交互作用往往就意味着当使用另一个效应指标时存在某种交互作用。例如,若以 OR为效应尺度,当两个因素均有效应,但无相乘效应的交互作用时,若以 RR为效应指标,两因素间则可能存在相乘效应的交互作用。
因此,交互作用的存在与否不仅受选统计模型的影响,也与所用的效应尺度有关,故Rothman建议,为避免混淆,在提到交互作用时,应当用“精确”的词来描述其尺度或测量,如“未检测到偏离了可加性的率差”、“未检测到偏离了可乘性的率比”,等等。
三、交互作用与混杂因素
在研究中,由于某些研究者不关心的因素本身对结局变量有影响,且该因素在研究因素各组间分布不均衡,从而导致对研究因素真实效应的估计出现偏倚,这些研究者所不关心的因素称为混杂因素(confounder)。如果研究者在研究设计阶段意识到混杂因素的存在,并使其在研究因素各组间达到均衡,那么混杂因素的干扰便会得到控制。而在流行病学研究中,尤其是在病例-对照研究和横断面调查中,由于不能像在一般的实验性研究中对许多因素进行控制,因此混杂因素的干扰往往是客观存在的。
由于混杂和交互作用均表现为多个因素同时存在时使得某一因素的作用强度之表现形式发生改变,因此往往难于区分。一般而言,可以从以下三点来分辨:
1.从本质上来讲,交互作用是研究因素所固有的一种属性,与研究设计无关,是客观存在的;而混杂往往是由于研究者在实验设计过程中的疏漏所造成的,是可以消除的。
2.交互作用与研究的真实性无关,作为一种客观效应,是研究者希望报告的,应加以准确而详尽的描述;而混杂则不同,它是对研究真实性的一种歪曲,是研究中要极力避免并防止发生的。一旦发现,要通过适当的统计学方法加以控制,否则将导致对研究因素效应的估计出现偏差。
3.交互作用可以通过统计学方法进行定量描述和评价,但是不可能去除其影响;混杂则可以在资料分析阶段通过适当的统计学分析方法控制其对研究因素效应估计的干扰。
值得注意的是,有些因素虽然是混杂因素,但本身也与研究因素间存在交互作用,如在研究肺癌的危险因素时,若吸烟和遗传因素同时存在时,发生肺癌的风险要大于吸烟单独的风险和遗传单独的风险之累积,则可认为两者间存在着交互作用。但在有些家庭中,父亲曾经吸烟,且患有肺癌,儿子受父亲影响,也有吸烟习惯,此时可能会出现因肿瘤家族史与吸烟相关所导致的混杂。这时需要谨慎加以区分和解释。
在统计学模型中,由于纳入某个因素后,导致另一因素的效应估计值出现了较大的改变,而两者的交互作用却无统计学意义,在样本含量足够时,则往往可以认为这两个因素之间存在混杂;若两者间的交互作用有统计学意义,则应当考虑,这两个因素间是否同时存在着混杂和交互作用。
四、生物学交互作用与公共卫生交互作用
本章介绍的交互作用主要是基于统计学定义的,可以理解为一种表现形式。而在医学研究中,交互作用还有其他的定义。
生物学交互作用是一种“机制上的交互作用”,强调了一种因果关系,即用环境暴露等外在因素及基因等内在因素导致的生理、生化改变来阐述交互作用的具体作用机制。但从生物学角度上,同一结局事件的发生,可能有几种截然不同的解释机制,因此研究者提出了多种生物学交互作用的定义方法,如反事实法(counterfactual approach)、充分病因法(sufficient cause approach)等。详见有关的理论流行病学著作。
若暴露或者干预的成本或效益通过它们的变化所导致的新增病例的增减或其他效应指标来衡量,则以这类效应指标为基础的交互作用称为公共卫生学的交互作用。例如,在研究石棉暴露和吸烟与肺癌的关系的队列研究中,若单纯去除吸烟导致的新增病例减少加上单纯去除石棉暴露导致的新增病例减少,少于同时去除吸烟和石棉暴露导致的新增病例数减少,这种对可加性的偏离对应于公共卫生学的交互作用。