第五节队列研究_医学科学研究与设计-QQ阅读中文轻小说网

上QQ阅读APP看书，第一时间看更新

第五节　队列研究

队列研究，又称为前瞻性研究、发生率研究（incidence study）、随访研究（follow-up study）及纵向研究等，目前常用的名称是队列研究。

队列研究是分析流行病学（analytical epidemiology）研究中的重要方法之一，它通过观察对某因素处于不同暴露状况的人群的结局，以探讨该因素与所观察结局的关系。它与后述的病例对照研究一样，主要用于检验病因假设，但其检验病因假设的效能优于病例对照研究。通常在应用病例对照研究对病因作出初步检验后，再应用队列研究作进一步验证。

一、基本概念

队列（cohort）来自拉丁字母cohors，原意是指古罗马军团中的一个分队，在流行病学中用以表示一个特定的研究人群。一般情况下，队列是指具有共同经历、共同暴露于某因素或共同具有某特征的一组人群，如职业队列、吸烟队列、学生队列等。出生队列（birth cohort）也是队列的一种，但它是指在某特定时期内出生的一组人群，如1980年队列就是指在1980年出生的一组人群。根据人群进出队列的时间不同，队列又可分为两种：固定队列（fixed cohort）和动态队列（dynamic cohort）。固定队列是指研究人群都在某一固定时间或一短时期之内进入队列，直至观察期结束，成员几乎不发生变动，队列保持相对固定；动态队列是指某队列确定后，在整个观察期内新成员可以随时加入，原有成员也可不断退出。

暴露（exposure）是指研究对象接触过某种待研究的物质（如放射线、营养素等）、具备某种待研究的特征（如性别、体重等）或行为（如吸烟、锻炼等）。这些物质、特征或行为即为暴露因素。暴露因素可以是先天具备的，也可以是后天获得的；可以是对人有害的，也可以是对人有益的。待研究的暴露因素也称为暴露变量（variable）。

结局（outcome）是指研究对象接触或具备某暴露因素后，产生的可能与暴露因素有关的结果。就结局本身而言，它可以是定性的，也可以是定量的；可以是研究对象发病、死亡等不良后果，也可以是研究对象得到保护或健康状况好转等良性结果。当然，结局也可以仅仅表现为研究对象接触或具备某暴露因素后生物学参数的变化（不界定有益或有害）。结局又称为结局变量或结果变量（outcome variable），在队列研究中指随访观察中将出现的预期结果事件。

危险因素（risk factor）是指能引起某不良结局发生，或使该不良结局发生概率增加的因素，包括遗传、环境、行为生活方式等方面的因素。例如，吸烟是肺癌发生的危险因素；高盐饮食是高血压发生的危险因素。

二、基本原理

队列研究的基本原理是在一个特定人群中选择研究对象后，根据是否暴露于某因素或其不同的暴露水平将研究对象分为两组（如暴露组和非暴露组）或几个不同的亚组（如高、中、低剂量暴露组），然后随访观察一段时间，追踪各组人群待研究的预期结局的发生情况（如疾病、死亡、其他状态或特征），比较各组结局发生率的差别，从而判断该因素与结局有无关联及其关联大小。例如，吸烟与肺癌的关系研究中，如果吸烟组的肺癌死亡率高于不吸烟组，且差异有统计学意义，则提示吸烟与肺癌之间存在关联，吸烟可能是肺癌发生的危险因素。队列研究的基本原理见图2-1。

图2-1　队列研究的过程示意图

队列研究具有以下特征。

1．属于观察性研究

研究对象的暴露与否或暴露水平在研究开始之前就已客观存在，而不是人为给予或随机分配的，整个研究过程不施加任何干预措施。例如吸烟与肺癌的关系研究中，有无吸烟这一行为是研究对象自身具备的，并不是研究者人为造成的。

2．必须设置对照

有比较才能发现差别。设置对照的目的就是通过比较使暴露因素的作用能得以体现。原则上，非暴露组（对照组）除了未暴露于某因素之外，其余各方面都应尽可能与暴露组相同。对照组与暴露组可来自同一人群，也可来自不同的人群。

3．由“因”到“果”的研究

由于所研究的暴露因素在研究开始前就已经存在，研究者在掌握了研究对象的暴露情况后，通过随访前瞻性地观察出现的结果，因此，队列研究能明确提出暴露与结局的时间先后关系，即“因”在前，“果”在后。

4．能确证暴露因素与结局的因果关联

由于队列研究能准确计算结局的发生率，估计暴露人群发生某结局的危险程度，结合暴露与结局的时间先后，一般可以确证暴露与结局的因果关联。

基于以上特征，队列研究主要用于深入检验病因假设。就吸烟与肺癌的关系研究而言，它不仅可以检验一种暴露（吸烟）与一种结局（肺癌）之间的因果关联，还可同时检验该暴露（吸烟）与多种结局之间（如糖尿病、高血压等）的因果关联。此外，队列研究还可用于评价某些暴露（如戒烟）的预防效果；研究疾病的自然史或预后；对新药上市后进行监测等。

三、研究类型

根据研究对象进入队列时间及终止观察时间的不同，队列研究可分为前瞻性队列研究（prospective cohort study）、历史性队列研究（historical cohort study）和双向性队列研究（ambispective cohort study），后者也称为历史前瞻性队列研究（historical prospective cohort study）。

1．前瞻性队列研究

这是队列研究的基本形式，也称为即时性队列研究（concurrent cohort study）和纵向研究。在前瞻性队列研究中，首先根据研究开始时研究对象所处的暴露状况（有无暴露或暴露水平）来对研究对象进行分组，随后通过前瞻性地观察一段时间以获得研究结局。该研究类型所获资料比较完整和准确，偏倚较小，但由于所需样本含量较大，耗时长、花费多，因而其可行性受到一定程度的影响。

选择前瞻性队列研究时，应重点考虑：①应有明确的检验假设；②待研究疾病的发病率或死亡率一般不低于5‰；③应明确规定暴露因素，且能准确获得观察人群的暴露资料；④应明确规定结局变量，且能准确获得观察人群的结局资料；⑤应有足够的观察人群并可以划分为暴露组与非暴露组；⑥大部分观察人群应能长期随访，并获得完整、真实、可靠的资料；⑦应有足够的人力、财力、物力保障研究工作顺利进行。

2．历史性队列研究

又称回顾性队列研究（retrospective cohort study）。该类型研究的起点是过去某个时间，基于历史资料，根据当时的暴露状况确定研究对象并分组，到现在某个时间感兴趣的结局已经发生。这种研究类型又称非即时性队列研究（non-concurrent cohort study），其特征是暴露到结局的方向是前瞻性的，而收集信息的方法是回顾性的。由于研究的结局已经发生，因此能够较快得出结论，而且费用较低。但这种研究方法需要有现成的暴露与结局的详细记录，因而其资料不如前瞻性队列研究完整和准确。该类型队列研究多用于职业暴露与结局的关系研究，因为往往只有单位（机关、厂矿等）才有比较完整的职工历年来暴露与结局的资料或信息。

3．双向性队列研究

指在历史性队列研究之后，继续进行前瞻性队列研究。这种研究同时具有回顾性队列研究和前瞻性队列研究的性质，既具有上述两种研究的优点，在一定程度上又弥补了它们的不足。在实际应用中，适宜于评价对人体健康同时具有短期效应和长期作用的暴露因素。例如，某种暴露在人体短期作用可能造成肝功能损害，长期作用可能导致肝癌。此时可考虑设计双向性队列研究，即以人群现有的结局（肝功能损害的发生）先进行历史性队列研究，检验该暴露与肝功能损害的关联，然后继续进行前瞻性研究，检验该暴露与肝癌的关联。

四、队列研究的设计与实施

由于队列研究耗时长，花费大，质量控制要求较高，因此在进行队列研究之前首先要有合理的研究假设。例如，Doll与Hill在1951开展的吸烟与肺癌关系的队列研究，就是基于此前的生态学研究（烟草消耗与肺癌死亡率有平行关系）和病例对照研究（吸烟与肺癌有关联）的结果而构思的；其次要进行严谨的研究设计。因为队列研究过程影响因素众多，如果缺乏良好的设计，容易造成研究失败。

无论何种类型的队列研究，其设计与实施均包括以下过程和步骤。

（一）确定研究因素

研究因素在队列研究中常称为暴露因素或暴露变量。由于队列研究一次只能研究一个因素，因此暴露因素的选择、定义和测量事关研究全局。

暴露因素的选择，应有相关描述性研究和病例对照研究的病因假设支持，同时必须考虑研究条件和伦理学要求。暴露的定义一定要准确，否则将影响结局的判断和资料的分析，也不利于其他研究者重复。一个完整的暴露定义，应包括暴露的水平、暴露的时间、暴露的方式（如直接暴露或间接暴露、一次暴露或长期暴露）等内容。暴露的测量，必须采用敏感、精确、简单和可靠的方法。

（二）确定研究结局

如前所述，结局既可是定性的（如是否发病或死亡），也可是定量的（如抗体滴度、血脂水平）；既可是最终后果（如发病或死亡），也可是中间过程（如分子或血清的变化）。在测定结局时，应给出明确统一的标准，并在研究的全过程中严格遵守。在实际工作中，根据研究需要，结局既可按国际或国内统一的标准进行判断，也可按自定的标准进行判断（如某些非预期结局），以便收集各类结局信息研究一因多果的关系。

在队列研究中，结局是指观察终点（end-point），即研究对象出现了预期的结果，它与观察期的终止是两个不同的概念。如Doll与Hill的研究中，观察人群发生了因肺癌的死亡即出现了结局。观察期的终止是指全部观察工作的截止时间。

（三）研究对象的选择 1．暴露人群的选择（1）特殊暴露人群：

特殊暴露人群是指高度暴露于某因素的人群。如长期、高剂量地暴露于某危险因素的职业人群；受到某种意外、灾害或事故影响的特殊人群等。选择该类人群作为研究对象，不但所需人数较少，而且较易发现暴露与疾病之间的可能联系，因此特殊暴露人群常常作为队列研究的首选人群。如研究石棉导致肺癌的作用时选择石棉作业工人；研究放射线与白血病的关系时选择受过放射线辐射的人群。

（2）一般人群：

即从某区域范围内的全体人群中选择暴露于待研究因素的人作为暴露组。当研究目的主要是针对于一般人群的防治，或所研究的因素和疾病是一般人群中常见的（具有较高的暴露率和发病率），则适合在一般人群中选择暴露组。

为了提高随访质量和研究效率，实际工作中也常常选择有组织的人群作为研究对象，如学生、士兵、社会团体、专业协会的会员等。选择此类人群有利于组织和随访，而且由于该类人群的背景或经历往往相同，其可比性也较好。如Doll和Hill的研究就选择了英国医师会员作为研究对象。

2．对照人群的选择

设立对照组是为了与暴露组比较，因此选择对照组的核心问题是尽可能保证其与暴露组的可比性，常见的形式有以下几种。

（1）内对照：

在同一研究人群中，将其中暴露于待研究因素的对象作为暴露组，其余未暴露者为非暴露组（对照组），不需从其他人群另设对照组或非暴露组。当研究的暴露变量是定量变量时，可将暴露分成不同水平，以最低水平暴露的人群作为对照组。Doll和Hill的研究中，对照来自于同是医师会员的不吸烟者。

（2）外对照：

当暴露组选择的是特殊暴露人群时，常常需要另外选择一个人群作为对照组，故称外对照。例如，若以某冶炼厂的工人为暴露组来研究镉与肿瘤的关系时，则可以选择基本情况（如年龄、性别、民族、居住地区）相似的另外一个无镉污染工厂的工人作为对照组。

（3）总人口对照：

当以特殊暴露人群作为暴露组时，如果样本量较少，不便进一步分组计算年龄、性别、发病（死亡）率，此时可以利用总人口率为对照进行比较。

在实际应用时，为了避免人口构成的差异可能产生的偏倚，并不将暴露组的发病（死亡）率与总人口的发病（死亡）率进行直接比较，而是采用标化比，如标化发病比（standard incidence ratio，SIR）或标化死亡比（standard motality ratio，SMR）作间接比较。

（四）样本含量的估计

详见第六章。

（五）资料的收集与随访 1．资料的收集

在研究对象选定之后，应详细收集每个研究对象从研究开始、随访、出现观察终点、观察终止等各个阶段的信息，内容主要包括研究对象的基本情况、暴露资料和结局资料。研究对象的基本情况包括年龄、性别、职业、文化、婚姻、行为习惯、疾病与健康等个人状况以及家庭环境、家族疾病史等家庭状况。

2．随访

随访是队列研究中收集资料的主要方式，随访的质量直接关系到研究工作的质量。

在随访的过程中，暴露组和非暴露组的研究对象都应以同样的方法、同样的态度进行随访，并一直追踪到观察终止期。随访的方法包括对研究对象的直接面对面访问、电话访问、自填问卷、定期体检，或利用医院病历、死亡登记、疾病报告等资料。在整个随访过程中，随访方法应保持不变。

随访的内容包括研究对象的基本情况、暴露资料和结局资料，重点是结局资料，同时也要收集有关暴露状况的资料，以便及时掌握暴露的变化情况。随访的时间长短根据不同疾病的潜隐期、疾病的自然史及已暴露时间来确定。随访应由经过专业培训的调查员进行，并有严密的组织系统进行质量监督。

在Doll和Hill的研究中，对男医师随访了20年，女医师随访了32年，期间函调3次。除了研究之初收集研究对象的基本情况、暴露资料外，在随访期间重点收集研究对象的迁移动态、死亡情况及死因。

（六）资料的分析

队列研究的资料分析主要是计算暴露组与非暴露组的结局发生率（如发病率或死亡率），通过检验各组结局发生率是否存在差异，判断暴露因素与结局之间有无联系，如有联系，则进一步计算有关指标分析联系的强度。

1．人时的计算

队列研究观察时间较长，观察对象经常处于动态变化之中，例如暴露组和非暴露组的研究对象进入观察的开始时间不同，或因死亡、迁出及其他原因在不同时期退出队列，从而造成观察时间的不一致，因此以人为单位计算率就不合理，此时应以人时（person time）来描述观察对象的暴露经历。理论上，人时的计算为观察人数乘以观察时间，如10人观察10年为100人年，100人观察1年也为100人年。在实际应用中，人时的计算较为复杂，常用的人时单位是人年（person year）。

2．率的计算

队列研究中，结局发生率的计算是整个资料分析的重点，根据资料的特点可以选用不同的指标。队列研究基本数据一般整理成表2-2或表2-3的格式。

表2-2　队列研究累积发病率数据整理表

表2-3　队列研究发病密度数据整理表

（1）累积发病率：

当观察期间研究人群数量较多且比较稳定时（相当于固定队列），可以计算某病的累积发病率（cumulative incidence），即以整个观察期内的发病人数为分子，以观察开始时的人数作分母（见表2-2）。累积发病率的量值变化范围为0～1，没有单位，其流行病学意义有赖于对累积时间长度的说明。累积发病率也常被称作“危险度（risk）”或“发病比例（incidence proportion）”。

（2）发病密度：

当队列研究观察的时间比较长，期间研究对象出现动态变化时（相当于动态队列），应以整个观察期内的发病人数为分子，以观察人时为分母计算发病率（见表2-3），由此计算出来的率带有瞬时频率性质，故称为发病密度（incidence density）。人时的时间可以用任何单位，但最常用的是年，发病密度的量值变化范围从0到 + ∞，其单位为时间 ⁻¹。

3．率的假设检验

由于队列研究多为抽样研究，如果计算得到的两组样本率有差别，首先应排除抽样误差的影响，故需进行假设检验。当观察的样本含量较大时，样本率的频数分布近似正态分布，可以应用正态分布的规律进行率的假设检验，即采用 u检验的方法来检验暴露组与非暴露组两总体率的差异。如果样本率比较低，或样本含量较小时，可用二项分布或泊松（Poisson）分布进行率的假设检验。另外，率的假设检验也可以采用四格表资料的 χ ²检验或Fisher确切概率法。假设检验方法的具体使用可参阅有关统计学专著。

4．效应的估计

当率的假设检验推断为有差别时，可以进一步分析暴露因素与结局的关联强度。由于队列研究可以直接计算出研究结局的发生率，因而也就能够直接计算出相对危险度（relative risk，RR）和归因危险度（attributable risk，AR），从而直接、准确地评价暴露的效应。

（1）相对危险度RR：

也叫危险度比（risk ratio）或率比（rate ratio），是反映暴露与发病（或死亡）关联强度的最佳指标。危险度比是暴露组与非暴露组的累积发病率之比，而率比是暴露组与非暴露组的发病密度之比。

RR表示暴露组发病（或死亡）的危险是非暴露组的多少倍。当 RR = 1时，表示暴露因素对疾病的发病（或死亡）无影响；当 RR＞1时，表示暴露因素为危险因素，它使发病（或死亡）的危险增大；当 RR＜1时，表示暴露因素为保护因素，它使发病（或死亡）的危险减小。 RR值越大，表明暴露的效应越大，暴露与结局关联的强度越大。常用的判断标准见表2-4。

表2-4　相对危险度与关联的强度

（李立明．流行病学．第6版．北京：人民卫生出版社，2007：71）

总体相对危险度 RR的点估计为

（2-11）

或

（2-12

由于

是一个点估计值，考虑到抽样误差的存在，需计算总体 RR的可信区间（通常用95%的可信区间）。对于大样本而言，累积发病率资料（表2-3）的总体 RR的可信区间估计可用式（2-13）计算，其反自然对数即为总体 RR的95%可信区间。

（2-13）

发病密度资料（表2-4）的总体 RR的可信区间估计可用式（2-14）计算，其反自然对数即为总体 RR的95%可信区间。

（2-14）

（2）归因危险度AR：

归因危险度又称为特异危险度、率差（rate difference，RD）和超额危险度（excess risk），是暴露组发病率与非暴露组发病率相差的绝对值，它表示疾病危险特异地归因于暴露因素的程度。为了表述方便，暴露组的累积发病率或发病密度均以 I _e表示，非暴露组的累积发病率或发病密度均以 I ₀表示。

AR = I_e−I₀

（2-15）

或

所以

（2-16）

（3）归因危险度百分比：

归因危险度百分比（attributable risk proportion or percent，ARP，AR%）又称为病因分值（etiologic fraction，EF），是指暴露人群中的发病（或死亡）归因于暴露的部分占全部发病（或死亡）的百分比。

（2-17）

（2-18）

（4）人群归因危险度与人群归因危险度百分比：

人群归因危险度（population attributable risk，PAR）是指总人群发病率中归因于暴露的部分。人群归因危险度百分比（ PAR%）也叫人群病因分值（population etiologic fraction，PEF），是指 PAR占总人群全部发病（或死亡）的百分比。

PAR和 PAR%的计算式如下：

PAR = It−I0

（2-19）

I _t代表全人群的率， I ₀为非暴露组的率

（2-20）

PAR%亦可由下式计算：

（2-21）

式中 P _e表示人群中有某种暴露者的比例。

（5）剂量反应关系的分析：

如果某种暴露存在剂量效应关系，则该暴露作为病因的可能性就越大。其分析方法是先列出不同暴露水平下的发病率，然后以最低暴露水平组为对照，计算各暴露水平的相对危险度和率差。必要时，应对率的变化作趋势性检验。

5．标化比的计算

当研究对象数目较少（如特殊暴露人群），不便计算发病率或死亡率，或者无法获得发病率或死亡率资料时，可通过计算标化比来分析。即以全人口发病（死亡）率作为标准，计算出该观察人群预期发病（死亡）人数，再求观察人群中实际发病（死亡）人数与此预期发病人数之比，即得标化发病（死亡）比。与前述的效应估计指标类似，标化比反映的是观察人群的发病或死亡危险是一般人群的多少倍。不过，标化比不是率，而是以全人口的发病（死亡）率作为对照组计算出来的比。最常用的指标为标化死亡比 SMR，其计算公式为：

（2-22）

SMR＜1，说明观察人群的死亡危险小于一般人群； SMR＞1，说明观察人群的死亡危险大于一般人群； SMR = 1，说明观察人群的死亡危险与一般人群相等。

SMR的95%可信区间估计公式为

（2-23）

五、常见偏倚及其控制

偏倚即研究误差中的系统误差。队列研究属于观察性研究，在设计、实施和资料分析等各个环节都有可能产生偏倚。常见的偏倚类型有选择偏倚、信息偏倚和混杂偏倚。

（一）选择偏倚

只要研究人群（样本）不是一般人群（总体）的一个无偏的代表，就会引起选择偏倚。主要体现在选取研究对象时，没有采用随机抽样，而是使用志愿者或方便样本；研究对象的纳入或排除没有遵循严格的标准，研究对象不参与（不应答）或失访等，都可能导致入选对象与未入选对象之间存在系统差异，从而使暴露与结局的关联程度被高估或低估。

在队列研究中，失访是最值得注意的一种选择偏倚。由于随访期较长，期间难免有研究对象因迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列，这种退出称为失访（loss of follow-up）。观察人数越多，时间越长，失访越容易发生。失访从本质上破坏了原有样本的代表性。如果暴露组和非暴露组的失访人数相等，而且两组中失访者和未失访者的发病率相同，则可以认为失访对研究结果没有影响，否则暴露与结局的关系可能因为失访而被歪曲。一项研究的失访率最好不超过10%，否则应慎重考虑结果的解释和推论。

减少选择偏倚的方法主要是尽量使暴露组和非暴露组除研究的暴露因素以外的其他各种条件保持均衡，严格按照随机化的原则选择研究对象，严格掌握纳入和排除标准，增加应答和减少失访等。

（二）信息偏倚

在获取暴露、结局或其他信息时，由于测量或资料收集方法的问题所产生的系统误差称为信息偏倚。信息偏倚可来自于研究对象、研究者本身以及用于测量的仪器、设备、方法等。信息偏倚将导致暴露错分（如判断暴露为非暴露）或疾病错分（如判断有病为无病），故又称为错分偏倚（misclassification bias）。使用的仪器不精确、询问技巧不佳、检验技术不熟练、诊断标准不明确、医师诊断水平不高、人为的记录错误等均可能产生信息偏倚。

减少信息偏倚，应分别针对研究者、研究对象、测量仪器与方法采取相应的措施。如尽可能采用“盲法”收集资料，制定细致的资料收集方法和严格的质量控制技术，尽量采用客观指标的信息，校准仪器设备，提高调查技能，加强工作责任心等。

（三）混杂偏倚

由于一个或多个外部因素的存在，掩盖或夸大了研究因素与疾病的联系，从而部分或全部地歪曲了两者之间的真实联系，称为混杂偏倚（confounding bias）或混杂（confounding）。引起混杂的因素称为混杂因子（confounder）。

混杂因子必须与所研究疾病的发生有关，是该疾病的危险因子之一；必须与所研究因素有关；必须不是研究因素与疾病病因链上的中间环节或中间步骤。满足这些基本条件的混杂因素如果在所比较各组间分布不均，就可导致混杂偏倚的发生。在流行病学研究中，性别、年龄是最常见的混杂因素。

为了减少混杂偏倚，在研究设计阶段可对研究对象作某种限制，以便获得同质的研究样本；在对照选择中采用匹配的办法，以保证两组在一些重要变量上的可比性；在研究对象抽样中，严格遵守随机化的原则；在资料的分析阶段，采用标准化率分析、分层分析、多因素分析等统计方法。

六、病因与因果推断

流行病学的重要任务之一就是探索和揭示疾病的病因或危险因素，以更有效地预防和控制疾病。在早期，病因（cause）通常被理解为产生结局或效果的原因。随着概率论因果观的发展，流行病学中的病因一般称为危险因素，意指使疾病发生概率升高的因素。由于概率论的引入，因果关系被理解为具有时间先后的相关关系，即可能的病因与疾病之间应具有相关关系，且该病因发生于疾病之前。另外，在流行病学工作中经常要对防治效应进行观察和评价，如果某防治措施使特定效应发生的概率升高，则该措施就是特定效应的原因。在防治措施与特定效应形成的因果关系中，时间的先后顺序是比较明确的。

然而，两事物具有相关关系并不一定就是因果关系。因为这种关联（广义的关联等同于相关）可能是由于随机误差引起的偶然关联，也可能是具有统计学意义的关联（排除了随机误差的干扰）；有统计学意义的关联可能是单纯的数量关联，也可能是因果关联（排除了偏倚的干扰，且有时间先后顺序）。

（一）统计学关联与因果关联 1．统计学关联

若可能的病因与疾病存在统计学关联（statistical association），只说明该病因与疾病的关联排除了偶然性（随机误差）的干扰。这种关联只是一种数量上的关联，可能是虚假联系或间接联系，也有可能是因果关联。当然，只有在两者具有了统计学关联后，才有了进一步判断因果关系的基础。

2．因果关联

要确定因果关联（causal association），需在具有了统计学关联后，进一步排除选择偏倚、信息偏倚和混杂偏倚等系统误差的干扰，并确定可能的病因与疾病的时间先后关系。在具有统计学关联并排除了虚假联系或间接联系的前提下，仍然需要用因果推断标准进行综合评价，才能得出不同程度的因果关系结论。

（二）常用的因果推断标准

这里的因果推断包括病因推断和防治效应推断。

1．关联的时间顺序

如果怀疑某病因（或防治措施）X引起疾病（或特定效应）Y，则X必须发生于Y之前，即具有前因后果的时间顺序。如不能明确断定X与Y的时间顺序，也必须存在X先于Y发生的可能性。在确定前因后果的时间顺序上，实验研究和队列研究最好。

2．关联的强度

一般而言，关联的强度越大，该关联为因果关联的可能性就越大。反映关联强度的指标有相对危险度（RR）、比值比（OR）、剂量反应关系等。

3．关联的可重复性

指关联可以在不同的人群、不同的地区和不同的时间重复观察到。关联的可重复性越好，该关联为因果关联的可能性就越大。实验性研究由于实验条件容易控制，其可重复性较好。

4．关联的合理性

指在现有的知识背景和认识能力下，对关联能够进行合理的解释。例如，吸烟与肺癌的因果关联，虽然不能通过人体试验研究来证实，但设想有害物质随烟雾长期吸入并沉积在呼吸系统的组织和细胞上，引起癌变不是没有道理的。

5．研究的因果论证强度

因果性研究的设计类型与它的论证强度存在密切关系。一般而言，在因果论证强度上，实验性研究大于观察性研究，有对照的研究大于无对照的研究，以个体为分析单位的研究大于以群组为分析单位（生态学）的研究。如果条件允许，病因研究最好采用前瞻性队列研究，防治效应的因果性研究最好采用随机化对照试验。不同研究设计类型的因果论证强度排序见表2-5。

表2-5　研究设计与因果论证强度