医学科学研究与设计
上QQ阅读APP看书,第一时间看更新

第一节 临床试验概述

一、临床试验的定义
广义的临床试验是指在人为条件控制下,以特定人群为受试对象(患者或健康志愿者),以发现和证实干预措施(药品、特殊检查、特殊治疗手段)对特定疾病的防治、诊断的有效性(包括药品的作用、吸收、分布、代谢、排泄)和安全性(不良反应)。临床试验为比较两种或更多种诊断或治疗措施提供基础;为诊断或治疗结果的正确性提供最大程度的可信性;为观察结果的差异提出有参考意义的结论。一般包含新药临床试验、医疗器械临床试验和实际临床试验等。医疗器械临床试验是指获得医疗器械临床试验资格的医疗机构对申请注册的医疗器械在正常使用条件下的安全性和有效性按照规定进行试用或验证的过程,其目的是评价受试产品(医疗器械)是否具有预期的安全性和有效性。
狭义的临床试验即新药临床试验,国际协调会议(the international conference on harmonisation,ICH)关于临床试验的定义是:任何旨在揭示或证实产品的临床、药学或其他药物动力学的效应,识别、研究产品的不良反应、安全性或效果,或试验药物的吸收、分布、代谢以及排泄而在人身上进行的研究。我国国家食品药品监督管理总局在《药品临床试验质量管理规范》(自2003年9月1日起施行)中的定义为:指任何在人体,不论是在患者或在健康志愿者身上所进行的药品的系统性研究。意在揭示或证实试验药品的作用,和(或)检出其任何不良反应,和(或)试验药品的吸收、分布、代谢和排泄,目的为确定其疗效与安全性。
二、药物临床试验的分期
根据不同类别的新药要求进行临床试验分期验证和生物等效性试验。生物等效性试验不分期,仅适用于化学药品的第四类、第五类新药。对于难以进行生物利用度比较试验的药品则需按照临床试验进行探索性和验证性试验。它是在完成临床前研究工作后进行,按照不同分期依次进行,各个分期有相应要求。
我国《药品注册管理办法》(自2007年10月1日起施行)规定临床试验分为Ⅰ、Ⅱ、Ⅲ、Ⅳ期。
Ⅰ期临床试验:也称临床药理和毒性作用实验期,为初步的临床药理学及人体安全性评价试验。试验的主要目的是观察人体对于新药的耐受程度以及其药代动力学,为制定给药方案提供依据。在人体首先观察的是药物的安全性而不是疗效,它通常在健康志愿受试者中实施。在受试者,根据预先规定的剂量,由小到大一次一人的增加,以确定可以接受的剂量,而不引起毒副作用。在进行多次给药试验的实践基础上摸索适合Ⅱ期临床试验需要的剂量和程序,该期需要病例数较少,一般为20~80例。
Ⅱ期临床试验:也称临床治疗效果的初步探索试验。其目的是初步评价药物对目标适应证患者的治疗作用和安全性。本期临床试验以较小规模的病例数对药物的疗效和安全性进行临床研究。在此期间药物疗效和安全性必须对每一名患者进行严格观察。同时还需要进行药代动力学和生物利用度研究,以观察患者和健康人药代动力学的差异。此阶段的研究设计可以根据具体的研究目的,采用多种形式,包括随机盲法对照临床试验。该期的病例数比一期多,一般为100~300例。Ⅱ期临床试验是Ⅰ期临床试验的延续,设计是基于Ⅰ期临床试验研究结果的实践基础上,并继续观察短期不良反应或副作用以及补充药理学信息。为Ⅲ期临床试验研究设计和给药剂量方案的确定提供依据。
Ⅲ期临床试验:治疗作用确证阶段,也称治疗的全面评价临床试验。在前两期临床试验研究的基础上,初步确定新药有较好的疗效以后,需用相当数量的同种病例与现有的标准药物进行大规模的对比研究。其目的是进一步验证药物对目标适应证患者的治疗作用和安全性,评价利益与风险关系,累积更多的安全性数据,探索未被发现和认识的状况,观察附加的适应证,最终为药物注册申请提供充分的依据。试验应为具有足够样本含量,一般为1000~3000例的多中心随机盲法对照试验。Ⅲ期临床试验是在Ⅱ期临床试验基础上全面评价新药的疗效和安全性,是对新药研究认识的不断深化和发展。
Ⅳ期临床试验:也称为销售后临床监视期,是新药上市后由申请人自主进行的应用研究阶段。其目的是考察在药物广泛使用时的疗效和不良反应,评价其在普通或者特殊人群中使用的利益与风险关系,并通过长期大量实践来充分证实新药研究成果的可行性和实际应用价值。Ⅳ期临床试验通过临床调查,监视药物使用时副作用的发生率,观察可能出现而从前没有被发现的安全性问题,如只有在很大样本含量时才能被发现的、或只影响某些特殊人群的,或经过长期观察才能被发现的某些罕见的、严重的潜在不良反应。如果发现有明显的新药缺陷(如疗效不明显、副作用发生率高且严重),上市后仍可淘汰。此外,还应进一步考察对患者的经济与生活质量的影响。Ⅳ期临床试验可以使更多临床医师了解新药,认识新药,进一步收集有关安全性、附加的剂量讯息、其他未发现的适应证等资料。
三、临床试验应注意的问题

(一) 伦理学问题

临床试验作为一种以“人”为受试对象的实验研究,必须面对医学伦理学问题。早在1964年,世界医学协会颁布了《赫尔辛基宣言》,《宣言》强调指出,“开始每一项在人体中进行的生物医学研究之前,均须仔细评估受试者可能预期的风险和利益。对受试者利益的关注应高于出自科学与社会意义的考虑。”它是生物医学研究伦理学领域中的基本国际性文件,影响着国际、地区、国家的立法和行为准则的制订。《赫尔辛基宣言》曾修订多次,最近一次是2008年10月在韩国首尔举行的第59届世界医学大会上。它为从事临床与非临床生物医学研究的医师规定了一般的伦理准则,即所有涉及人类受试者的研究都应遵守“尊重人,有利,公正”三条基本伦理原则。

(二) 均衡性问题

疾病的发生发展与转归受自然因素和社会因素的多重影响,在临床试验中,除研究因素以外,更多的非研究因素难以完全控制。如评价西尼地平胶囊治疗轻中度原发性高血压的疗效和安全性的随机、双盲双模拟阳性对照临床试验,鉴于血压受环境影响的因素颇多,比如生理活动、睡眠活动、生活环境变化等,都可以导致血压的变化,同时医疗环境和医疗处理等复合因素也对药物的疗效有所影响,因此在试验设计时要进行周密安排和设计,尽可能控制这些非研究因素。比如可以采用分层随机分组,使非处理因素在试验和对照组分配均衡;严格设计和制定试验方案,明确诊断标准、纳入标准、剔除标准,统一治疗标准和治疗方法等,尽可能保证除组间处理因素外,其他条件的一致。但在实际研究中有些偏倚往往难以发现和控制,因此需要客观看待研究结果。

(三) 依从性问题

临床试验的受试对象常常是患者,其个体之间在生理特点、心理状态、文化水平及所处的自然环境、社会经济状况都存在差异,其疾病的发展和转归也会因人而异,这些差异常常会造成患者在临床试验中不一定能遵从医嘱使干预治疗措施得以完全的落实,如患者不能坚持按时、按量用药,这种现象称为患者的依从性(compliance)差。另外,由于患者不能集中进行试验观察,干预措施的开始时间和结束时间也不尽相同,患者有可能自行停止干预治疗而造成“失访”。在临床试验过程中收集资料时患者不一定能完全配合,导致资料的缺失或质量太差。临床试验的依从性好坏和“失访”患者的多少常常与临床试验设计关系密切,因此,在临床试验设计时必须制定有效的措施提高患者的依从性,减少受试者的“失访”,并制定一些测定依从性高低的方法,以估计依从性对试验结果影响的程度。

(四) 效应指标设计问题

效应指标是指能反映临床试验中药物有效性和安全性的观察项目。

1.主要指标和次要指标

主要指标又称目标指标或终点指标,是与试验目的有本质联系的,能确切反映药物有效性或安全性的观察指标,通常主要指标只有一个,如果在研究方案中定义多个主要指标时,由于可能出现多重性问题,在统计分析时应考虑对Ⅰ类错误进行调整。主要指标应根据试验目的选择易于量化、客观性强、重复性好,并在相关研究领域已有公认的准则或标准。主要指标必须在临床试验前确定,并用于试验样本含量的估计。次要指标是指与试验目的相关的辅助性指标,在试验方案中,也需明确定义,并对这些指标在解释试验结果时的作用以及相对重要性加以说明。次要指标数目也应当是有限的,并且能回答与试验目的相关的问题。如评价治疗2型糖尿病药物的有效性时,糖化血红蛋白是评价其有效性的主要指标之一,而空腹血糖和餐后2小时血糖是次要指标。对这些指标在解释试验结果时的作用以及相对重要性可在研究方案中加以说明。

2.复合指标

在有些临床试验中,难以确定单一观察指标作为该试验的主要指标,则可按预先确定的计算方法,将多个指标组合构成复合指标,如临床上采用的量表就是一种复合指标。复合指标被用作主要指标时,组成这个复合指标的单个指标如果有临床意义,也可以同时单独进行分析。

3.全局评价指标

全局评价指标是将客观指标和研究者对受试者疗效的总印象有机结合的综合指标,它通常是有序等级指标。用全局评价指标来评价某个治疗的总体有效性或安全性,一般都有一定的主观成分。如果必须将其定义为主要指标时,应在试验方案中有明确判断等级的依据和理由。全局评价指标中的客观指标一般应该同时单独作为主要指标进行分析。临床医师有时习惯将某些客观测量指标和研究者对受试者疗效的总印象有机结合起来组合成一个综合评价指标,如常用痊愈、显效、好转、无效的有序等级指标作为疗效综合评价指标,评价某个治疗的总体有效性,一般都有一定的主观成分。

4.替代指标

替代指标是指如果不能通过观测实际临床效果来直接评价试验对象的临床效果时,用于间接反映临床效果的观察指标。替代指标所提供的用于临床效果评价的证据的强度取决于:①替代指标与试验目的在生物学上相关性的大小;②替代指标对临床结果预后判断价值的流行病学证据;③从临床试验中获得的药物对替代指标的影响程度与药物对临床试验结果的影响程度相一致的证据。如在评价治疗肿瘤药物的有效性时,患者生存率是客观评价的终点指标,如果以该指标作为主要疗效指标时,临床试验需很长时间,这时,常常用瘤体大小的变化作为一个公认的替代指标。

5.指标转换

根据临床评价的需要,有时需将测量指标根据该指标改变程度等于或超过某一数值时作为分类的定义,将其转换为二分类或多分类的指标,如在评价降压效果时,舒张压是测量指标,如果将治疗后舒张压与正常舒张压临界值比较,可分为血压正常和异常两分类指标。分类指标的定义应在试验方案中明确规定。由于测量指标转换为分类指标通常会丧失部分信息,因此,如果以转化后的分类指标作为主要指标分析时,容易导致检验效能的降低。
四、临床试验的基本步骤
以药物临床试验步骤为例说明,见图4-1。

1.筹备阶段

申办者(药物研究机构或药厂)向药物临床试验机构递交临床试验申请材料,经试验机构审核后登记建档并签字立项。双方共同商定项目临床试验执行小组,并设计试验方案和CRF,经申办者、研究者讨论通过后交由伦理委员会审核,伦理委员会进行伦理评审后将审批意见交机构办公室存档。

2.实施阶段

通过伦理委员会审核后,由项目临床试验执行小组按GCP(Good Clinical Practice)规范和试验方案,实施临床试验,并定期访视患者、填写病例报告表、填报严重不良事件、联系协作单位等。临床试验过程中,申报单位可进行定期随访,专家组亦可定期检查。

3.总结阶段

临床试验结束后,项目临床试验执行小组检查并完善试验资料的登记,项目执行人撰写总结报告并由专家审定后,将总结报告和原始资料归档,交由药物临床试验机构签字盖章后交予申办者。
图4-1 药物临床试验基本步骤框图
注:CRF:病例报告表 IRB:机构审查委员会 SAE:严重不良事件
五、临床试验中常见偏倚及其控制

(一) 常见偏倚 1.选择性偏倚

选择性偏倚是在临床试验中,由于选择的试验对象或观察指标不恰当而引起的偏倚,这种偏倚使得从样本得到的结果推广到总体时出现系统的偏差。
消除或防止选择性偏倚产生的有效办法是在临床试验设计阶段对产生选择性偏倚的原因采取相应的措施,防止偏倚的产生。一旦选择性偏倚已经发生,再进行校正往往是比较困难的。防止选择性偏倚的关键是临床试验设计人员能够预见或估计到本临床试验可能出现哪些偏倚。在设计阶段要尽量采取防止选择性偏倚产生的措施,必须正确拟定受试对象的入选标准和排除标准。在实施阶段,要严格按照研究方案规定的条件纳入受试者,对临床试验对象要随机分组,必要时采用分层随机分组。尽量使两组除研究的处理因素不同外,其他的有关条件和影响因素应均匀一致,使两组的主要基线特征具有可比性。

2.观察性偏倚

观察性偏倚是由于在临床信息收集、整理过程中各种原因的影响而出现的误差,可来自临床试验的观察的全过程。
控制观察性偏倚的产生,主要是在收集信息阶段,针对产生观察性偏倚的原因采取相应措施。加强对临床试验人员的试验前的培训,提高临床试验质量;采用盲法来收集资料和数据,使临床研究人员、受试者在不知道分组的情况下对试验效应做出客观、公正的测量或评价,对临床试验所用的测量仪器也要在使用前加以校准,并严格执行标准操作规程。

3.混杂偏倚

临床试验中混杂偏倚是指当研究某一处理因素与疾病的疗效关系时,另一种伴随的非处理因素产生的效应,干扰着处理因素所产生的效应,这一伴随因素称为混杂因素。混杂因素常发生在资料分析阶段,常由于影响实验结果的非处理因素在各对比组中分配不均衡但未采取校正所引起。疾病的转归除了药物的治疗作用外,还与疾病的自然过程、辅助治疗及患者的体质因素等有关。如果只注意干预措施与疾病之间的联系而忽略了其他因素在各对比组中的均衡问题,就会发生混杂偏倚而容易导出错误的结论。例如,在比较两种治疗方法的有效率时,甲组为38%,乙组为62%,似乎乙组优于甲组。按患者病情轻重分层分析时,发现在同一病情下的两组有效率相同,这是由于两组不同病情患者的比例不等,导致了合计有效率的差别。因此,患者入组时的病情程度是一个混杂因素。
要较好地控制混杂性偏倚,首先可按可预期的重要混杂因素进行分层随机设计,试验过程中严格执行随机化方案,使潜在的混杂因素在各组分布均衡。在统计分析时应将重要的混杂因素进行分层分析或作为协变量分析。

(二) 常见偏倚的控制方法 1.盲法

所谓盲法系指按试验方案的规定,不让参与研究的受试者,或研究者,或其他有关工作人员知道患者所接受的是何种处理(试验药或对照药),从而避免他们对试验结果的人为干扰。
盲法(blind method)是为了避免研究者和受试者的主观因素对试验结果的干扰的重要措施。盲法分双盲(double blind)和单盲(single blind)两种。我们将参与试验过程的所有人员,包括临床医师、护士、监察员、数据管理人员、统计分析人员统称为研究者。所谓双盲临床试验是指研究者和受试者在整个试验过程中不知道受试者接受的是何种处理;单盲临床试验是指仅受试者处于盲态。
当观察指标是一个受主观因素影响较大的指标,例如神经功能缺损量表中的条目得分是由研究者主观判定后估计的,这时必须使用双盲试验。至于客观指标(如生化指标、血压测量值等),为了客观而准确地评价疗效也应该使用双盲临床试验设计。
在双盲临床试验中,盲态应自始至终地贯穿于整个试验,从产生随机数、编制试验盲底、试验处理的随机分配、患者入组后的治疗、研究者记录试验结果并做出疗效评价、试验过程的监查、数据管理直至统计分析都必须保持盲态。统计分析前的揭盲,可采用一次或两次揭盲的方式,两次揭盲一般用于试验组与对照组按1∶1设计,先在数据文件经过盲态审核(blind review)并认定可靠无误后将其锁定,进行第一次揭盲,此次揭盲只列出每个病例所属的处理组别(如A组或B组)而并不标明哪一个为试验组或对照组,交第三方进行统计分析。当统计分析结束后进行第二次揭盲,以明确各组所接受的治疗。
与盲法试验相反的是开放试验(open trial),即不设盲的试验,研究者和受试者都知道具体治疗方案。由于研究者或受试者对试验的信赖,或受试者对研究者的信任,在填写记录时某些受主观因素影响较大的指标值就可能出现先入为主的观念。如当一个研究者知道受试者所接受的是试验药物时,可能对受试者的治疗情况倍加关心,如增加检查的频度,甚至护理人员也会格外关心该受试者,他们的这种行为很可能会影响受试者的态度,从而不知不觉地影响观察指标的真实性。而当受试者知道自己所用的是对照药物或安慰剂后,也会产生心理影响,妨碍或干扰与研究者在临床研究上的配合,造成偏倚。因此,即使在开放试验中,研究者和参与试验效应评价的研究人员最好不是同一个人。如果使参与评价的人员在评判过程中始终处于盲态,就能将偏倚控制到最低限度。

2.随机化

随机化是指参加临床试验的每一个受试者都有同等的概率(机会)进入治疗组或对照组,不以人们的意志为转移,完全按照随机编排的序号人组。其目的为排除分配误差,可以使各处理组的各种影响因素(包括已知和未知的因素)分布趋于相似,使病例或试验对象均匀分配到各试验组。临床试验的随机化包括分组随机和试验顺序随机,与盲法合用,有助于避免因处理分配的可预测性而产生的分组不均衡性偏倚。
因为在进行随机对照临床试验时,必须把患者安排到各个处理组中去。但由于临床试验中的各种原因,有时会有意或无意地安排某些患者(具有某类特征)到某组,从而影响疗效的正确评价,如把病情轻的患者分配到新药组,将导致高估新药的疗效。由于没有遵循随机化原则,将导致各组间统计学假设检验难以符合概率论和数理统计的基本原理,无法进行相应的统计推断。
临床试验的随机表是用文件形式写出的对受试者的处理的随机安排。在最简单的情况下,它是处理(在交叉试验中是处理顺序)的序列表,或者是按受试者号的相应编码。不同的试验设计编制随机表的过程亦不相同。由于临床试验入选受试者的过程较长,为减少季节、疾病流行等因素对疗效的影响,一般采用区组随机化方法安排受试者,这将有助于增加处理组间的可比性,另外更易保证各处理组的样本含量接近相等。
在多中心临床试验中,应按参加试验的中心组织随机化过程,即按中心分层,分层随机化有助于保证层内的均衡性。另外为了使各层趋于均衡,避免产生混杂偏倚,还可按照基线资料中的重要预后因素(如病症的严重程度)等进行分层。随机化时的分层因素在分析中应加以说明。