医学科学研究与设计
上QQ阅读APP看书,第一时间看更新

第二节 医学科学研究设计

医学科研设计是对科学研究的具体内容的设想和计划安排,直接关系到科研课题的科学性、创新性、可行性,影响课题完成的速度和研究结果的可靠性等。任何设计上的缺陷,都很难在事后得到弥补。
一、医学科学研究设计的目的和任务
医学科研设计是关于研究方法与步骤的具体内容。无论实验研究、临床疗效观察或现场调查,都应根据具体的研究内容和目的,结合统计学的要求,针对研究的全过程进行研究设计。目的是使所进行的研究具有:目的性、独创性、适用性、可行性、可重复性和经济性。
医学科研设计的设计思路是,首先要明确研究目的,根据研究目的拟定一个科研课题的题目。内容包括:选定能反映所研究问题的各项分析指标,使抽象的研究目的具体化;划定研究的总体范围;确定调查方法或实/试验方法;估计样本含量大小;制定资料的整理分析计划;在整个研究过程中的每一个环节进行质量控制;进行经费预算;确定研究工作的步骤与时间进度等。
一个周密而完善的研究设计,能合理地安排各种研究因素,严格地控制误差,从而用较少的人力、物力和时间,最大限度地获得丰富而可靠的资料,减少误差,达到高效、快速和经济的目的。为此,在设计时必须遵循对照、随机化、重复和均衡的原则。反之,如果研究设计存在缺陷,就可能造成不应有的浪费,且足以减损研究结果的价值。尤其在医学科学飞速发展的今天,对客观事物的认识越来越深,实验研究中考虑的因素也越来越多,所用的指标越来越多样化,对结果的精确度要求也越来越高,因而,对相应的研究设计方法亦提出了越来越高的要求。总之,研究设计是研究工作过程的依据,是研究数据处理的前提,也是提高科研成果质量的一个重要保证。
二、医学科学研究设计的分类及其特点
医学研究的类型很多,不同的分类标准有不同的研究类型,相应地有不同的研究设计类型。医学研究从研究的目的可以分为验证性研究(confirmatory study)与探索性研究(exploratory study);从研究的方式可以分为观察性研究(observational study)与实验性研究(experimental study)两种;从研究的指标数量可以分为单因素研究与多因素研究;从研究的时限来看,可以分为前瞻性研究(prospective study)、回顾性研究(retrospective study)和横断面研究(cross-sectional study)。从研究的对象可分为:以一般人群为基础的社区研究,以患者为基础的临床试验,和以动物、标本或其他生物材料为基础的实验性研究。研究设计类型取决于不同研究类型的特点及其所研究内容的专业特点、研究目的和研究对象等条件。

(一) 以是否对研究对象施加干预为主干进行分类

从统计学的角度出发,医学科学研究按照对研究对象是否进行干预分为观察性研究和实验性研究两大类(图1-1)。
图1-1 医学研究类型以是否对研究对象施加干预为主干分类示意图

1.观察性研究设计

观察性研究工作往往不需对研究对象采取任何干预措施,只要到现场对已显示的结果、存在的现况等有关因素进行观察或调查就可以了,是客观地反映事物的实际情况,能为今后决策和进一步深入研究提供依据。如了解某年某省恶性肿瘤死亡率;某地学龄前儿童贫血的患病率;某地某年学龄儿童的身体发育状况等。其目的在于摸清某一事物的水平和分布现状。常用的方法有横断面研究、病例对照研究(case-control study)和队列研究(cohort study)等。
观察性研究,又称调查研究。调查研究设计的基本内容包括调查计划的制订、资料的整理分析和质量控制以及抽样方法的选择等。调查设计是调查研究工作的先导和依据,也是调查结果准确可靠的保证。调查设计的特点是:研究因素是客观存在的,如职业、地域、民族等。不能用随机化分组来平衡混杂因素对调查结果的影响,故重点是调查表、分析表与抽样方法设计。研究中需特别注意:事先明确研究对象总体,以及样本的选择方法,样本需有代表性,因此选择样本时需遵循“随机抽样”的原则,避免偏性;在确定调查目的、范围、对象的基础上拟定一套完善的调查表,既要方便记录、又要方便数据管理和数据的计算机录入,同时编写相应的“调查须知”、“填表须知”等,以便随时参照;正式调查前最好作一次小规模预调查,以取得经验,并对调查表进行必要的修改和完善;若调查涉及范围广,参与人员多,则应事先对调查员进行统一培训,对调查中所用仪器设备进行统一调试、统一标准和统一要求。第二章将详细介绍观察性研究设计。

2.实验性研究设计

实验性研究设计以人、动物或生物材料为研究对象,在研究实施过程中研究者根据研究目的对研究对象主动施加干预措施,控制非研究因素的干扰,并观察总结其结果,回答研究假设所提出的问题。例如研究魔芋精粉可否降低大白鼠血中的胆固醇含量,首先可将若干只条件相近的大白鼠随机地分配入两组,用高胆固醇饲料和高胆固醇加魔芋精粉饲料作为干预措施,在试验过程中控制其他因素对试验结果的影响。经过观察总结和分析,得出魔芋精粉是否有降低胆固醇作用的结论。实验研究的特点是:研究者能人为设置研究因素;研究对象接受研究因素的种类或水平是由随机分配决定的。因此,实验研究中能够更有效地控制误差,使多种研究因素包括在较少次数的实验之中。
根据研究对象不同分为:以动物、标本或其他生物材料为研究对象的实验研究和以人为对象的试验研究。
实验研究中最常见的是动物实验研究,无论是药理学、毒理学、微生物学、寄生虫学、遗传学直到近代的分子生物学、分子遗传学等学科,以及新药的临床前试验等均需要动物实验研究。动物实验的优点之一是在许多方面可以由实验者作出目的性的安排,可以根据研究目的采用较严格的控制措施。因此,可以设计得更严密一些,在比较实验中可以要求对比各组间可比性更强一些。但我们必须清醒地认识到,动物和人对同一研究因素的反映既有共同性又有差异性。认识这种共同性和差异性,对评价动物实验结果对人类医学的作用有重要的意义。例如,动物实验的结果不能直接用来解释人类的现象。如动物常常存在代谢途径的缺陷,如猪有硫酸酯形成障碍、狗有芳香胺乙酰化缺陷、豚鼠有硫醚氨酸形成障碍等。另外,也有些代谢反应仅存在于人和某些灵长类动物。不同种系的动物有不同的生物学特点(包括发病特点),如有些小白鼠好发乳腺癌,这时应设立同一种系(或株)的动物作对照,以鉴别某种物质的致癌性。
此外,动物实验中,常会发生意外死亡。一方面应尽量防止这种情况的发生;另一方面,一旦有动物死亡,要分清是实验药物中毒死亡还是其他原因死亡。要根据研究工作的实际情况决定是否放弃死亡动物的实验数据,绝不能一律弃之。第三章将详细介绍实验研究设计。
以人为对象的试验研究包括临床试验研究和社区人群干预试验研究。在设计时必须充分考虑以人为对象的特点,如人的社会性、心理因素等。在试验研究设计中受试者情况复杂,应注意以下几个方面。

(1) 严格设立合理的对照:

因为研究对象是人,如何设立对照组(control group)必须慎重考虑。决不允许研究工作由于设立对照组而对人的健康有所危害。

(2) 严格遵照随机分组(random allocation):

试验中的受试对象进入哪个处理组必须十分严格、科学,以保证各处理组间非处理因素的均衡性。

(3) 严格遵守盲法:

避免研究者的主观偏见,注意受试对象反映的真实性:医师总是有“被治的患者病情好转”的愿望。临床试验中尽可能采用“双盲法”(double blind),就是研究者方(医师、护士等直接参与临床试验观察者)和受试者方(受试者、家属等)都不知道受试者使用的是试验药还是对照药。这是避免偏性的一种技巧。但有时患者依据他对医师及治疗措施的信任程度可能会有某些不自觉的不真实的反应。这就要求研究者应尽可能选择客观指标作为评价疗效的根据,谨慎使用主观性较大的指标。第四章将详细介绍临床试验研究设计。

(二) 以研究时限为主干进行分类

从研究的时限来看,可以分为纵向研究(longitudinal studies)与横断面研究,见图1-2。
图1-2 医学研究类型以研究时限为主干分类示意图

1.纵向研究

是先施加干预然后再观察结果,能够有效地判断研究因素与结局的关联,因此主要应用于检验疾病的病因假设。如社区人群干预试验;或先得到观察结果再分析产生结果的原因,如某病治疗后的疗效分析。常用于外部因素对人体的影响及其影响程度的研究。纵向研究中,在研究开始时将研究对象是否“暴露”于某因素进行分组,再获得观察结果,称为前瞻性研究。在研究开始时将研究对象是否有“阳性”结果进行分组,再追溯以前获得是否“暴露”于某因素的信息,称为回顾性研究。联合运用前瞻和回顾两种方式的称为历史前瞻性研究(historical prospective study)。“暴露”因素可以是人为设计的干预,如临床试验中的不同治疗方法;也可以是不可人为干预的某些因素,如各种遗传、环境因素。“暴露”因素是人为设计的干预且做到随机化分组的研究又被称为实验性研究。“暴露”因素为非干预因素或不能进行随机化分组的研究又被称为观察性研究。

2.横断面研究

在同一时间点或短的时间段内,对某人群中应用普查或抽样调查方法收集特定时间内人群中有关疾病与健康状况的资料,以描述疾病或健康状况在地区、时间和人群中的分布规律以及观察某些因素与疾病之间的关联,属于观察性研究方法,通常没有干预因素。横断面研究可以为分析性研究中待检验的疾病因果关系(disease causation)提出初步假设,由于在调查时暴露变量与结局变量是同时测量的,两者的先后顺序不清楚,因此不能得出因果关系的结论。
重复横断面调查(repeated cross-sectional surveys)用来检查疾病或危险因素随时间变化所呈现的趋势。如美国疾病控制中心(CDC)通过全国药物滥用家庭调查(national household survey on drug abuse,NHSDA),在1974、1980、1985和1991年分别收集12~19岁儿童的吸烟情况,观察美国青少年吸烟分布规律与变化趋势。
三、医学科学研究设计的基本内容
对于具体的科研工作,科研设计涵盖了其全过程,从选题和立题,课题的具体实施(资料收集、数据整理和分析、研究质量控制等),到研究工作的总结(撰写研究论文、申请研究成果和专利)。科研设计分为两个方面,即专业设计和统计设计。①专业设计是运用专业理论技术知识来进行的设计,即从专业理论角度来选定具体的研究课题,提出假说,围绕检验假设制定技术路线和实验方案。主要解决科学研究的有用性和独创性,它决定了科研成果的大小。专业设计的正确与否是科研成败的决定因素。②统计设计是运用统计学知识和方法来进行的设计。减少抽样误差和排除系统误差,保证样本的代表性和样本间的可比性,确保实验观察内容的合理安排,以便使研究结果进行高效率的统计分析,以最少的实验观察次数(例数)得出相对最优的结果和可靠的结论。主要解决科研的可重复性和经济性问题,是科研结果可靠性和经济性的保证。总之,专业设计和统计设计是科学研究设计的两个重要组成部分,二者相辅相成,缺一不可。
从统计学角度来讲,研究设计的基本内容包括:建立研究假说,明确研究目标,确定研究对象、研究单位和总体(population)、样本(sample),对研究对象是否施加干预和如何施加干预,确定研究设计类型,确定研究指标及获得指标值的方法,制定数据的管理及统计分析计划,预计会得到什么结果,资料的可靠性及质量控制,需要多少经费与时间等问题。这些内容都要周密考虑、统筹安排,力求科学、实用、可行。

(一) 建立研究假说,明确研究目标

在专业知识的基础上建立假说,随后进一步把研究假说表达为研究中要解决的具体问题,即具体的研究目标。一项研究要解决的问题不可能太多,一般为1~2个,常称之为研究的主要问题。在回答主要问题的同时,能回答几个与研究假设有关的其他问题,称之为次要问题,来进一步补充和完善本次研究的结果。如研究某药对高血压患者的降压效果,主要问题是:该药是否有效;该药是否安全;或与安慰剂对照组比,服药4周后,试验组患者血压下降值是否大于对照组患者血压的下降值。次要问题是:高血压患者服用该药后血压的波动情况,受试者的依从性如何;是否增加了治疗成本。
在研究中必须围绕主要问题进行各种安排,拟订研究计划,并采取有效的措施控制各种非研究因素的干扰,以确保本次研究的结果对主要问题做出确切的回答。不能试图通过一次研究解决或回答很多问题,或在没有明确主要问题和次要问题的情况下盲目开始试验,更不能在试验结束后依据得到的研究结果再去归纳出迎合研究者主观愿望的所谓主要问题和次要问题。

(二) 确定研究对象及其总体范围和数量

医学科学研究的研究对象的同质范围就是研究总体。根据不同的研究目的,研究单位可以是人、动物,可以是某个器官、血清、细胞,也可以是其他生物的、化学的、物理的实验材料等。统计学中对研究总体的要求是同质性(homogeneity),对样本的要求是代表性(representativeness),对临床试验来说还要考虑伦理性。只有当样本具有代表性时,所得研究结果才具有普遍性和推广价值。因此研究者在计划中要明确研究对象的总体范围。
实际中应该根据具体研究课题的目的和内容中的主要问题,兼顾次要问题来确定研究对象。例如研究某降血压药物的疗效,研究对象应该是所有高血压患者。在具体实施时,通常选择病情较轻的原发性高血压患者,并且没有心脏、肾脏、脑血管病变。这就要求研究者在研究计划中明确研究对象的总体范围,在临床研究中称为研究对象的纳入标准(inclusion criteria)。同时,规定不能作为研究对象的范围即排除标准(exclusion criteria)。纳入标准应注意选择对治疗结果反应灵敏和反应较稳定的患者作为研究对象。排除标准在确定时应考虑是否存在影响反应结果的并发症、病情危重状态、多种疗法无效、易导致依从性和失访性偏移和特殊人群(如孕妇应该排除在药物试验之外)等方面。性别、年龄等不作为研究因素,而是非研究因素时,对研究结果有可能产生影响,应该在各处理组之间处于均衡。
研究对象数量的确定即样本含量(sample size)的估计。样本含量太大,引起研究成本增加,有可能使工作难以完成和导致人力物力的浪费,且不易控制实验误差。太小,受偶然性的影响大,不易得出明确的结论,而且结论的可靠性差。因此样本含量的估计是研究设计中的重要内容,内容详见第六章。

(三) 确定研究因素与非研究因素

一般来说,研究因素是根据研究目的施加于研究对象的外界干预(在实/试验研究中,称为处理因素),可以是生物的、物理的、化学的,也可以是研究对象本身的某些特征,如性别、年龄、遗传特性、心理因素等。研究因素的确定必须根据具体的研究目的、内容而定。例如研究某种刺激与平滑肌机械反应的关系,某种刺激是研究因素;研究某种药物的疗效,这种药物便是研究因素。
研究过程中,除确定的研究因素之外还有很多其他因素会对结果产生影响,所以在确定研究因素的同时,必须明确哪些是非研究因素。非研究因素应当作为误差来源加以控制,研究者通过随机分组等方法,尽可能使全部非研究因素或重要的非研究因素在各组中分布均衡,最大限度地控制非研究因素对结果的影响。
在整个的研究过程中,研究因素应该保持一致不变。如研究因素为某一种药物时,在研究的全过程中应当使用同一厂家、同一种类、同一批号的药物,其剂量与给药途径保持不变。

(四) 拟定研究指标

研究指标是反映研究对象对研究因素的影响所产生的效应或反应。针对不同的研究目的和内容及其与研究指标之间的本质联系,来拟定相应的特异性研究指标。根据研究假设、研究的主要问题和次要问题,研究指标也分主要研究指标和次要研究指标。例如研究某种降压药物疗效,主要问题是:①高血压患者服药后是否有效;②服药4周后血压的下降值与对照药相差多大。对每一个患者来说,主要研究指标是:①服药后血压下降幅度、症状改善程度;②患者服药前、服药4周后的血压值。次要问题:①高血压患者服药后血压值的变化情况;②是否继发心脏病、脑血管病;③治疗成本是否较低。相应的次要研究指标是:①该患者服药前、服药后每天血压的波动情况;②试验观察期间是否发生心脏病、脑血管病;③该患者的治疗费用。
选择研究指标还应注意:①选择客观性好的指标。首选是能够精确测量的定量指标,如测量工具测量出结果、实验室仪器的检查结果、病理学的诊断意见等。一些依靠主观判定的指标,易受心理状态等影响,如患者的疼痛程度、疗效评价,也应尽量使其数量化,如将疼痛程度分级、给出疗效评分以及设置复合指标等。②选择的指标要能正确反映研究因素对研究对象引起的反应,即对研究因素的反应灵敏高的指标,使研究因素的效应能较好的显现出来。但是,灵敏度不是越高越好,如测定小鼠重量,以感量为0.5g的药物天平即可,若采用感量为0.1mg的分析天平,是不必要的。③与研究目的无关的观察指标不宜太多,否则将会冲淡主题,影响主要研究指标的准确性。

(五) 确定具体设计方案

观察性研究和实验性研究二者在实际操作中,根据其随机化和对照设置的不同,分为随机对照(randomized controls)与非随机对照(nonrandomized controls)研究。

1.随机对照研究设计

主要有平行设计(parallel design)和配对设计(paired design)等。

(1) 平行设计:

是将符合研究设计要求的研究对象随机分为两组(或多组),每个研究对象的研究起始时间与终止时间相等。什么样的研究对象(动物或受试者)符合研究设计要求,要按研究计划中的“纳入”和“剔除”标准加以选择。选定研究对象后,再进行随机分组。如研究某药治疗高血压的疗效,“纳入”标准首先应是轻、中度高血压患者(舒张压110~130mmHg,1mmHg = 0.133kPa),“剔除”标准是有严重肝肾疾病及肿瘤的患者。随机对照的平行设计格式见图1-3。
图1-3 随机对照的平行设计示意图

(2) 配对设计:

是对符合设计要求的研究对象,在随机分组以前,先按其生物学属性配对。如在动物试验中,将同一窝的动物配对,将体重相近的动物配对,将同一动物身体上的部位、器官配对等。在临床试验中,患者的年龄、性别、病情、入院时间都可作为配对因素。如用大白鼠进行营养学试验,将大白鼠按雌雄和体重配对,随机对照的配对设计模式见图1-4。
在观察性研究中,“暴露”因素不能进行随机分组,如正常人与患者某项测量指标的比较、不同疾病患者的某项测量指标的比较等。但在观察性研究可以通过配对设计有目的地选择样本,使不同对比组影响观察结果的主要因素(配对因素)达到均衡。最常用的配对方法是1∶1配对。如图1-5中,为了保证糖尿病患者的身体状况、性别和年龄3个配对因素与正常对照组相同,3个因素分层后共有3 × 2×2 = 12对子,每个对子各有1名糖尿病患者和正常对照。观察性研究中的配对设计只能保证少数因素的均衡性,随着配对因素的增多,用配对方法保证均衡性几乎不可能。所以,观察性研究通过配对达到“均衡”是相对的、有限的。
图1-4 随机对照配对设计示意图(T:试验,C:对照)
图1-5 观察性研究的配对设计示意图

2.非随机对照研究

在以人作为研究对象的试验中,因伦理学限制,不允许采用随机对照试验。常见的非随机对照试验有以下几种类型:

(1) 历史对照:

用历史文献或潜在对照(potential control)作为基线。潜在对照是以公认事实作为对照,如艾滋病无1例完全治愈。如果某药确实能治愈艾滋病,仅1例成功的报告,就能足以说明疗效。

(2) 前后对照:

对同一研究对象,以实施干预的前后进行对照。例如,据1986年英国医学会杂志报道(BMJ,1986,293(6554)∶1089-1090),为评价利用报纸进行预防艾滋病健康教育的效果,在报纸进行宣教前后,对来自选民登记表中的部分民众进行问卷调查,知道艾滋病致病原因的百分率分别为33%和34%,差异仅1%,说明报纸的宣传教育效果不佳。另据1985年英国医学会杂志报道(BMJ,1985,290(6474)∶1044-1046),为评价社区医师(GP)在健康教育中的作用,分别在健康教育前后对有GP工作的社区和无GP工作的社区的民众进行问卷调查,有GP工作的社区的体育锻炼率由教育前的39%提高到51%,无GP工作的社区由38%提高到45%,说明通过GP的健康教育,参加体育锻炼的人数提高了。同样是前后对照,后一例的结论更能说明问题。因为在后一例中,不仅仅是前后对照,还增加了一个平行对照。尽管对照组的体育锻炼率也提高了,但仍低于GP工作的社区,可解释GP的工作有效果。

(3) 准试验:

在前瞻性的研究中,试验组和对照组不能随机分配,称为准试验设计(quasi-experimental design)。如药品经批准上市后比较某药副作用的发生率,通过长期对服药者和非服药者副作用发生率的比较,可监测该药的安全性。

(六) 确定数据的统计分析方法

在研究计划书中还要规定研究数据的管理和统计分析方法,以保证资料及结果的准确性和可靠性。正确运用统计方法的前提是正确、良好的研究设计。特别是对人体进行的临床试验,如果试验前没有良好的设计,或者设计存在错误,那么,即使使用高级的计算机和复杂的统计方法处理数据,也无法弥补设计上的缺陷。对于医学研究者来说,统计问题咨询应该在一个研究项目开始之前,而不是在获取研究数据以后。没有系统学习过医学统计学的许多实际工作者常常错误地认为统计分析是在试验完成后才考虑的问题,而且不考虑研究目的、资料类型以及统计方法的前提条件等,就选择统计方法。需强调的是,研究设计、资料搜集与整理分析是科学研究的三个紧密联系的阶段,而设计是顺利地进行研究实施的先决条件,希望通过运用统计方法的计算来弥补设计上的错误是不可能的,也是有害的。具体内容参考第九章。

(七) 确定质量控制方法

在医学科学研究整个过程的各个阶段都有可能产生误差,使资料和结果失去真实性、可靠性。因此在设计阶段就要了解和掌握在研究的整个过程中有可能产生的各种误差,并事先针对误差规定对应的误差控制方法。误差包括抽样误差和非抽样误差,非抽样误差分为系统误差和过失误差,误差的控制主要是针对非抽样误差。如某研究要收集研究对象的血压值,规定在测量血压时,用每日清晨经同一血压计进行三次重复测量的血压值的平均数作为报告值。在临床医学研究中,来自于研究者和研究对象的主观性易引起结果的偏性,在设计时要采用盲法处理。由于误差的原因,需要对研究结果的数据质量进行评价,常采用重复研究和对比的方法。比如在调查研究中采用:①重复调查,计算符合率、对前后调查结果做一致性检验与相关性分析。②与不同来源的同类资料作对比。
研究设计的基本内容可以总结为是对研究因素、研究单位和研究效应三要素的设计。主要是根据研究目的和具体内容确定研究单位和研究总体,进行抽样设计,估算样本含量大小;确定研究(或处理)因素及其分配,正确设立对照和保持各组间的均衡性;选择能正确反映效应的研究指标,并确定准确的测量方法以及选择统计分析方法等。在体现重复、对照和随机三个基本原则的基础上,获得由样本到总体的正确推论。