医学科学研究与设计
上QQ阅读APP看书,第一时间看更新

第六节 病例对照研究

病例对照研究是分析流行病学方法中最基本、最重要的研究类型之一。该方法被广泛应用于探索疾病的危险因素、评价防治效果及预后等,特别在研究罕见病及慢性病的危险因素时是非常有效的方法。孕妇服用沙利度胺(反应停)与婴儿短肢畸形、母亲早孕期服用雌激素与少女阴道癌之间的关系等研究均是病例对照研究应用的经典范例。
一、基本原理
病例对照研究的基本原理是以确诊的患有某疾病的患者作为病例组,以不患该病的个体作为对照组,测量并比较病例组与对照组在疾病发生之前对某可疑因素(危险因素)的暴露情况,若两总体的暴露比例经统计学检验有差别,则可认为该可疑因素与疾病之间存在着统计学上的关联。研究过程见图2-2。
图2-2 病例对照研究的过程示意图

病例对照研究具有以下特征: 1.属于观察性研究

研究对象的暴露情况(暴露与否及暴露程度)已经发生,研究者只能客观收集暴露情况的资料,而不能施加任何干预措施。

2.必须设立对照

与队列研究不同,病例对照研究中的对照组是由未患所研究疾病的个体组成,用来与病例组进行暴露情况的比较。

3.观察方向从“果”到“因”

在研究开始时,已知研究对象患某病或未患某病,再追溯其既往是否暴露于可疑的危险因素。因而其研究方向是回顾性的、从果到因的。

4.一般不能确证因果关系

该方法可探索疾病的危险因素,建立或初步检验病因假设,但由于是回顾性的观察,无法确定暴露与疾病的时间先后,所以一般不能确证暴露与疾病之间是否存在因果关系。
二、研究类型

(一) 病例与对照不匹配

当明确了病例和对照的来源后,从规定的病例和对照人群中分别抽取一定数量的研究对象,组成病例组与对照组进行研究,对照组与病例组之间不设置限制(匹配)条件,此种情况称为病例与对照不匹配。

(二) 病例与对照匹配

匹配(matching)也称配比,即要求对照在某些因素或特征上与病例一致,从而在对病例组和对照组进行比较时可以排除匹配因素的干扰。如以性别作匹配因素,即为了避免两组性别构成的差异对研究因素和疾病之间联系的影响。匹配方法分为以下两种:

1.频数匹配

频数匹配(frequency matching)也称成组匹配(category matching),目的是使匹配的因素在对照组与在病例组所占的比例一致。如某项研究拟将性别作为匹配因素,当病例组男、女患者的比例各为50%时,则对照组中的性别比例也应如此。

2.个体匹配

以病例和对照的个体为单位进行匹配称为个体匹配(individual matching),即按照匹配因素为每一病例配上一个或一个以上适宜的对照。一个病例配一个对照时称为1∶1匹配或称配对(pair matching);一个病例配两个或两个以上的对照时分别称1∶2,1∶3,…,1∶M匹配。一般个体匹配不超过1∶4,否则流行病学净增加的效率并不明显。

(三) 病例对照研究的衍生类型 1.巢式病例对照研究

该设计于1973年由Mantel首先提出并在1982年正式命名。它是将队列研究与病例对照研究相结合的一种双向研究设计。首先在进行队列研究的基础上,收集队列成员的暴露信息以及有关的资料,在经历规定的随访期后,确认发生的所有病例,然后以这些病例作为病例组,并从同一个队列中为每一个病例选取一定数量的非病例作为对照组进行病例对照研究。

2.病例-队列研究

病例-队列研究(case-cohort study)又称病例参比式研究(case-base reference study),也是一种队列研究与病例对照研究结合的设计形式,1986年由Prentice提出。该设计即在队列研究开始时,在队列中按一定比例随机抽样选出一个有代表性的样本作为对照组,观察结束时,队列中出现的所研究疾病的全部病例作为病例组,与对照组进行比较。
除以上两种类型外,在20世纪90年代还陆续出现病例交叉研究(case-crossover design)、单纯病例研究(case only study)、病例-时间-对照设计(case-time-control design)等衍生类型,具体内容可参阅有关专业书籍。
三、病例对照研究的设计与实施

(一) 提出病因假设

在开始研究之前,一般应根据某疾病描述性研究(如横断面研究)的结果和已知的相关因素,对某疾病的病因提出假设。例如,英国的死亡登记报告显示,从1922年到1947年的25年内,肺癌的年死亡数从612例增加到9287例,几乎翻了15倍。经过年龄标化,发现1901~1920年,男性和女性肺癌年平均死亡率分别为1.1/10万和0.7/10万,而1936~1939年期间,男性和女性肺癌年平均死亡率分别上升至10.6/10万和2.5/10万,而且还呈继续上升趋势。值得注意的是,自1900年以来,当地烟草的消耗量也在呈现不断上升趋势。这种现象是不是提示吸烟和肺癌的发生有关呢?基于这种假设,Doll和Hill于1948开始了一项吸烟与肺癌的病例对照研究。

(二) 选择对照形式

由于研究目的不同、可获得研究病例的数量限制等情况,在选择对照形式时需考虑是否采用匹配、如何进行匹配等问题。例如,如果研究目的是广泛探索疾病的危险因素,可以采用不匹配或频数匹配的方法,其损失的信息量少;如果可得病例数很少(如罕见疾病),则选择个体匹配,以提高统计检验效率;如果选择兄弟姐妹、同事、邻居等作为对照,则只能采用个体匹配。另外,如果所研究的病例具有特殊构成(性别、年龄等),使得随机抽取的对照组难以与病例组均衡可比时,个体匹配就特别适合。
在病例对照研究中采用匹配的目的首先在于提高研究效率,表现为每一研究对象提供的信息量增加;其次在于控制混杂因素的作用。然而,一旦将不应该匹配的因素进行匹配,该因素就不能作为与疾病有关的研究因素进行分析,既丢失信息,又增加工作难度,反而降低研究效率,这种情况称为匹配过度(over-matching)。另外,匹配的因素越多,选择对照的难度越大,而且对照组与病例组就越相似,净增加的效应值将会越来越不明显。因此,匹配时应注意匹配的因素不能太多,而且匹配的因素必须是已知的混杂因子,至少也应有充分理由怀疑是混杂因子,否则不应进行配比。

(三) 病例与对照的选择

研究对象选择是病例对照研究设计中的关键问题,其基本原则是所调查的病例足以代表总体中的所有该病病例,对照足以代表病例组来源的总体中未患所研究疾病的人群,或对照组的特征与一般人群中的特征相同。

1.病例的选择 (1) 病例的来源:

病例来源主要有两种,一种是以医院为基础的,病例来源于一个或多个医院在一定时期内诊断的所有病例或其随机样本;另一种是以社区为基础的,病例来源于某一特定时间和地区内,通过常规登记、抽查或普查所获得的全部病例或其随机样本。

(2) 病例的类型:

可供病例对照研究的病例包括新发病例、现患病例和死亡病例。新发病例由于刚刚发病,对疾病危险因素的回忆可能比较准确。现患病例对既往暴露的回忆容易受到患病后环境条件和生活习惯改变的影响,不易判断暴露与疾病的时间关系。死亡病例只能由医学记录或家属提供,可靠性较差,较少利用。

(3) 对疾病的规定:

对研究的疾病要有明确的、统一的诊断标准,应尽量采用国际通用或国内统一使用的诊断标准。某些疾病需要自订诊断标准时,应注意采用灵敏度与特异度均较理想的检查方法,以保障自订标准的可靠性。

(4) 对病例其他特征的规定:

为了控制非研究因素的影响,在选择病例时应对人口学特征或其他外部特征作出明确规定,如对年龄、性别、民族等因素进行限制,以提高病例和对照的可比性。
在Doll和Hill的研究中,于1948~1952年间主要从伦敦的20家医院选择确诊为肺癌的患者,在其他城市也选择了一部分肺癌患者。

2.对照的选择

在病例对照研究中,对照的选择往往比病例的选择更复杂、更困难。选择对照时应注意:①未患所研究的疾病,但有暴露于研究因素的可能,即对照样本与源人群中未受影响者对研究因素的暴露频率是一致的。②未患与研究因素有关的其他疾病。对照可以是患其他疾病的病例,但是所患疾病的病因不能与研究的病因相同或相互影响。例如肺结核与慢性气管炎都与吸烟有关,两者不能互为对照。③与病例组均衡可比。通常要求两组除所要研究的因素外,其他各方面的特征如年龄、性别、职业、经济状况、种族、饮食习惯等应尽可能相似。在考虑对照与病例的可比性时,应注意对可比性因素要求不宜过多,因为可比性要求的因素愈多,对照的选择愈困难。
对照的来源主要有:①与病例同一医院的患其他疾病的患者。此种对照来源方便,而且应答率和信息质量均较高。②产生病例的一般人群(如社区人口)的随机样本。当病例是某一地区的全部或大部分病例时,可以从该地区未患该病的人群中选择对照,其优点是对照的代表性较好,结论外推的真实性也较高。③病例的邻居、亲属、朋友、同事、同学等。其优点是某些非研究因素能得到较好的控制,研究对象也容易合作,但不适用于研究遗传、生活习惯、膳食等因素,因为病例与对照在这些方面的特征可能是相同或相似的。④从以上两种或两种以上不同来源选择多组对照。选择多组对照可以增强结果的说服力。例如对一组病例,对照组可设健康人对照,也可以设多种其他疾病的患者作对照。如果多种对照均获得一致性结果,则可增强结果的说服力。
在Doll和Hill的研究中,选择了与病例在同一个医院的胃癌、肠癌等患者作为对照,此外,也选择了一部分非癌症患者作为对照。在对照的形式上,采用了1∶1配对,即一个病例配一个对照,对照的年龄、性别、民族、职业、经济生活条件、社会阶层等特征与病例一致或相似。

(四) 样本含量的估计

详见第六章。

(五) 资料的收集

在确定并选择病例与对照后,应根据研究假设收集与研究有关的各类信息,包括拟研究的暴露因素、可疑的暴露因素、潜在的混杂因素等方面。一般而言,收集的信息可以涵盖研究对象的人口统计学特征、生活环境、家庭背景、种族与宗教、社会与心理因素、行为因素、职业暴露、既往疾病与治疗情况等方面,但具体要纳入哪些因素(变量)及其具体项目则完全取决于研究目的,原则上与研究目的有关的变量必不可少,与研究目的无关的变量一个不要。
对纳入研究的暴露因素要有明确的定义。为了便于资料与结果的区域间比较,应尽可能采取国际或国内统一的标准。暴露因素的定义可以是定性的,也可以是定量的。如能实现定量,不仅使结论更为客观,而且还能进一步研究暴露与疾病的剂量反应关系,增强结论的说服力。
病例对照研究的资料收集有问卷调查、查阅记录、仪器测量、实地查看等途径。其中,问卷调查是最主要的途径,也就是使用专门设计的调查表通过询问的方式获取研究对象的暴露信息,必要时,辅以查阅记录、采样化验等方式。在资料收集时,应精心组织,严格操作,有效监督,保证资料收集的质量。必须做到统一调查表,统一标准、方法;以同样认真的态度收集病例组与对照组的资料;尽可能选用客观记录或客观指标;采取专业的手段进行质量控制,如抽取一定比例的样本予以复查,进行一致性检验;原则上,病例与对照调查应同时穿插进行,以减少某些未知的以及与时间有关的因素的可能混杂作用。
在Doll和Hill的研究中,通过自制的调查表收集所需信息。由于暴露信息是关键资料,因此除了研究对象的基本情况外,研究者重点收集了是否吸烟、开始吸烟的年龄、每日平均吸烟量、最大吸烟量、吸烟方式、是否戒烟、戒烟的年龄等信息。
四、资料的整理与分析
病例对照研究资料按照设计类型可分为不匹配和匹配资料,这两种类型的资料分析的内容均包括描述性分析和统计推断。

(一) 描述性分析 1.描述研究对象的一般特征

无论用哪种方法选择对照,都应首先对病例组和对照组数据的一般特征如年龄、性别、职业、出生地、居住地等进行描述,从而对资料的一般情况有一定的了解。

2.均衡性检验

根据对病例与对照之间除研究因素以外可能影响研究结果的各特征在两组的分布是否均衡来检验两组资料是否具有良好的可比性。如两组资料不均衡,对确有显著差异的因素,在分析时应考虑到它对其他因素的作用以及对暴露与疾病的关联可能产生的影响。

(二) 统计推断

病例对照研究中表示暴露与疾病之间关联强度的指标为比值比(odds ratio, OR),也译作优势比。比值(odds)是指某事件发生的可能性与不发生的可能性之比,其具体计算见表2-6。
表2-6 病例对照研究资料整理表
由表2-6,病例组的暴露比值为

(2-24)

对照组的暴露比值为

(2-25)

病例组和对照组暴露比值比的点估计值为

(2-26)

病例对照研究一般无暴露组和非暴露组的观察人数,故不能计算发病率或死亡率,亦就不能直接计算相对危险度( RR),只能用 OR来反映关联强度。 OR的含义与 RR类似,指暴露者患所研究疾病的危险是非暴露者的多少倍。 OR>1,说明暴露使疾病发生的危险增加,称为“正关联”; OR<1,说明暴露使疾病发生的危险减小,称为“负关联”; OR = 1,表示暴露与疾病无关联。如果研究的疾病发生率<5%, OR近似等于 RR

1.不匹配不分层资料

这是病例对照研究资料分析的最基本形式。对此种设计的资料分析可先将资料整理为如表2-6的四格表形式。

例2-2

Weicker等在1962年报告了关于母亲服用沙利度胺(反应停,一种治疗妊娠呕吐的药物)与新生儿短肢畸形的病例对照研究,数据见表2-7。
表2-7 母亲服用沙利度胺与新生儿短肢畸形的病例对照研究

(1) 假设检验:

利用 χ 2检验比较病例组的暴露比例( )与对照组的暴露比例( )有无统计学差异。

(2-27)

χ 2 0.005,1 = 7.88, P<0.005,结果为拒绝无效假设,即两组服用沙利度胺(反应停)的比例差别有统计学意义,提示母亲服用反应停与新生儿短肢畸形有统计学联系。

(2) 计算暴露与疾病的关联强度:

结果表明,服用反应停的母亲其产儿患短肢畸形的危险是未服用反应停的母亲其产儿的13.9倍。

(3) 总体OR的可信区间估计:

由于所计算的 值是点估计值,考虑到抽样误差,需计算总体 OR的可信区间(通常用95%的可信区间)。可用下述两种方法计算。
1) Woolf氏法:该方法是建立在 OR方差的基础上,以自然对数转换法计算。

(2-28)

自然对数的方差为:

(2-29)

本例,

求上述值的反自然对数,exp(1.0873,4.1764) =( 2.97,65.13),即 OR 95% CI =(2.97,65.13)。 OR的95%可信区间不包括1,说明该 值有统计学意义。
2) Miettinen氏法:

(2-30)

2.不匹配分层资料

分层分析的重要作用是估计和控制混杂因子。通过按混杂因子分层,可使混杂因子在病例组和对照组中均衡分布,从而消除其造成的偏倚。
在进行分层分析之前,首先要判断某因素是否可能为混杂因子。混杂因子必须与所研究疾病的发生有关,是该疾病的危险因素之一;必须与所研究因素有关;必须不是研究因素与疾病病因链上的中间环节或中间步骤。例如,某项吸烟与肝癌的病例对照研究中,饮酒与吸烟有关,饮酒也是肝癌的危险因素,同时,饮酒不是吸烟与肝癌之间的中间环节或步骤,因此,饮酒可能是混杂因子,此时可以将资料按是否饮酒分层,然后分别计算饮酒和不饮酒者中吸烟与肝癌的联系,从而消除饮酒的混杂作用。分层分析时可将资料整理如表2-8。
表2-8 病例对照研究分层资料整理表

例2-3

假设某项吸烟与肝癌的病例对照研究中获得资料如表2-9。结果显示两组吸烟暴露比例的差别有统计学意义,吸烟与肝癌有统计学联系,吸烟者患肝癌的危险是不吸烟者的2.45倍。由于饮酒可能是混杂因子,现将资料按是否饮酒分层后作进一步分析。
表2-9 吸烟与肝癌病例对照研究结果
= 2.45 χ 2 = 8.79 P<0.01
(1) 计算各层 :将资料按是否饮酒分层后整理成表2-10,计算各层
表2-10 按饮酒分层后吸烟与肝癌的关系
按式(2-26),计算各层的 值。饮酒层 = 1.40,不饮酒层 = 1.38。
(2) 判断各层的 值是否同质(表2-11):如果分层后各层的 值差异不大,说明各层 值对总体是同质(相等)的。各层 是否同质,可用Woolf齐性检验法进行检验。计算公式为

(2-31)

v = 层数−1

式中 ,ln 为各层 的自然对数。
本例计算如下:
表2-11 层间 值同质性检验计算的中间结果

可认为各层 值同质。
(3) 计算总的 OR估计值及 χ 2值:各层 经检验同质后,可计算总的 OR估计值及 χ 2值进行分析。用Mantel-Haenszel提出的公式:

(2-32)

将表2-10的数据代入,

计算总的 χ 2值,也用Mantel-Haenszel提出的公式:

(2-33)

式中 的理论值,

(2-34)

式中 的方差,

(2-35)

将表2-10数据代入,

v= 1,P>0.25。

估计总 OR的95%可信区间,可用Miettinen法的式(2-30)计算。代入数据,

该可信区间包括1,说明此 值无统计学意义。
由以上分析可以看出,分层调整后的 为1.39,如不分层分析,则 值为2.45,说明饮酒对吸烟与肝癌的关联有混杂作用,控制饮酒的混杂作用后,吸烟与肝癌无关联( χ 2 MH = 0.78, P>0.25)。
(4) 如果各层的 值差异较大,经假设检验差异有统计学意义(不同质),则不适宜计算总的 OR估计值及 χ 2值,可计算标化比值比(standardized odds ratio,SOR)或标准化率比(standardized rate ratio,SRR)等指标进行分析。有关具体内容请参阅其他专业书籍。

3.匹配资料分析:

如果研究按匹配方法进行,其资料亦应按匹配方法来分析。这里主要介绍1∶1匹配(也称配对)资料的分析。配对资料的分析可将资料整理如表2-12。
表2-12 1∶1匹配病例对照研究资料整理表

例2-4

为研究外源性雌激素与子宫内膜癌的关系,有学者进行了1∶1配对病例对照研究,有关数据整理如表2-13。
表2-13 外源性雌激素与子宫内膜癌关系配对资料

(1) 假设检验:

采用McNemar公式计算

(2-36)

此公式适用于较大样本,当 b + c<40时可用McNemar校正公式:

(2-37)

本例 P<0.005。

(2) 联系强度估计:

利用暴露史不一致的对子数进行估计。

(2-38)

本例

(3) 计算OR95% 可信区间:

可用Miettinen法的式(2-30)计算:

也可用下式计算:

(2-39)

其反自然对数即 OR95% CI
结果显示,两组使用外源性雌激素的暴露比例差别有统计学意义,提示外源性雌激素的使用与子宫内膜癌的发生有关联,使用外源性雌激素者患子宫内膜癌的危险为不使用者的9.67倍。
五、常见偏倚及其控制
病例对照研究作为一种回顾性的观察性研究,在设计、实施和资料分析的各个阶段也容易产生选择偏倚、信息偏倚和混杂偏倚。现将其常见的偏倚及其控制介绍如下。

(一) 选择偏倚

病例对照研究中的选择偏倚主要有:

1.入院率偏倚

入院率偏倚(admission rate bias)亦称Berkson偏倚(Berkson’s bias),是指利用医院就诊或住院患者作为研究对象时,由于入院率的不同而导致的偏倚。患者所患疾病的严重程度,不同医院的技术特点,患者的就医条件以及医疗保健制度等,均可影响入院率,而入院率的差别可能会夸大或掩盖某因素与疾病的真实联系。
减少此类偏倚,主要是在设计阶段尽量随机选择研究对象或在多个医院选择研究对象,使影响入院率的因素得到均衡。

2.现患病例-新发病例偏倚

现患病例-新发病例偏倚(prevalence- incidence bias)又称奈曼偏倚(Neyman bias)。由于研究对象选自现患病例,所获信息未必与该病的发病有关,而且现患病例可能已经改变了病前的生活习惯,从而导致对某因素与疾病关联的错误估计。
在研究开始时,将病例的纳入标准定为新发病例可以减小偏倚程度。

3.检出症候偏倚

检出症候偏倚(detection signal bias)是指某因素与某疾病本无关联,但患者却因该因素产生的症状或体征而及早就医,从而提高了该病的检出率,以致得出该因素与该疾病相关联的错误结论。
如果在收集的病例中同时包括早、中、晚期患者,则检出病例中此类暴露的比例会趋于正常,偏倚可以得到纠正。
除以上几种外,在病例对照研究中常见的选择偏倚还有时间效应偏倚(time effect bias)、易感性偏倚(susceptibility bias)、排除偏倚(exclusive bias)等。

(二) 信息偏倚

由于病例对照研究是回顾性的研究,相对于队列研究而言,更容易产生信息偏倚。常见的类型有:

1.回忆偏倚

指研究对象在回忆某些因素的暴露史时,由于在准确性和完整性上的差异所导致的系统误差。回忆偏倚在病例对照研究中最常见,主要表现为研究对象对调查的内容印象不深、记忆不清,或对调查不够重视,回忆的认真程度不同。
减少回忆偏倚的主要措施有:尽量利用客观的记录资料(如病历等);必须通过询问方式收集资料时,应尽量采取封闭式问题,以减少主观因素的影响;掌握提问方式和调查技巧,如选择一个与暴露史有联系的事件或目标帮助被调查者回忆等。

2.调查偏倚

在调查过程中,研究对象有意夸大或隐瞒某些信息,研究者调查技术不高、责任心不强、对病例与对照的态度不同,仪器设备不精确等情况,都可能导致调查偏倚。
减少调查偏倚,应尽量采用客观指标的信息;加强调查员培训,统一调查标准、调查方法和调查技巧;校准仪器设备,试剂、药品应符合要求;加强组织宣传工作,以取得研究对象的密切合作;尽可能采用“盲法”收集资料等。

(三) 混杂偏倚

病例对照研究中也常出现混杂偏倚。在设计时利用限制和匹配的方法,在资料分析阶段采用分层分析或多因素分析方法,可以对混杂偏倚进行一定的控制。
六、病例对照研究与队列研究的比较
病例对照研究是目前最常用的流行病学研究方法之一,随着学科的交叉和相互促进,其研究方法不断完善,应用范围不断扩大,并发展出一些新的研究类型。现将病例对照研究与队列研究的优点和不足比较如下(表2-14)。
表2-14 病例对照研究与队列研究的比较