口腔肿瘤生物学:基础和临床
上QQ阅读APP看书,第一时间看更新

第一节 功能基因组与蛋白质组 Section 1 Functional Genome and Proteome

1985年5月,美国能源部提出“人类基因组计划(HGP)”草案,1986年3月, Science发表了一篇有关开展人类基因组计划的文章,推动了人类基因组计划的发展。HGP的基本任务可用4张图谱来概括,即遗传图谱、物理图谱、序列图谱和基因图谱。初步分析表明人类基因组由31 647亿个碱基对组成,共有3万至3.5万个基因。此外,研究还发现与蛋白质合成有关的基因只占整个基因组2%。
基因组学(genomics)虽然在基因活性和疾病的相关性方面为人类提供了有力依据,但是实际上大部分疾病并不是因为基因改变造成的。同时,基因的表达方式错综复杂,同样的一个基因在不同条件、不同时期可能会起到完全不同的作用。关于这些方面的问题,基因组学是无法回答的。所以,随着人类基因组计划的逐步完成,科学家们进一步提出了后基因组计划,蛋白质组(proteome)研究是其中一个很重要的内容。
传统的中心法则是基因-mRNA-蛋白质,即遗传信息从DNA传递至mRNA,然后再合成各式各样的结构蛋白质和功能蛋白质,构成一种有机体,完成生命功能。三位一体构成遗传信息的流程图。随着人类基因组计划的实施和推进,生命科学研究已经进入了后基因组时代。尽管现在已有多个物种的基因组被测序,但在这些基因组中通常有一半以上基因的功能是未知的。同时,面对大量涌出的新基因数据,不得不考虑这些基因编码的蛋白质的功能。不仅如此,在细胞合成蛋白质之后,这些蛋白质往往经历翻译后的加工修饰。也就是说,一个基因对应的不是一种蛋白质而可能是几种甚至是数十种。包容了数千甚至数万种蛋白质的细胞是如何运转的?或者说这些蛋白质在细胞内是怎样工作、如何相互作用、相互协调?这些问题远不是基因组研究所能回答得了的。正是在此背景下,蛋白质组学(proteomics)应运而生。
大量研究资料表明疾病主要是多因素综合作用而非单一因素所致,是基因的翻译产物——蛋白质起着决定性的作用,因而,从基因水平转向从蛋白质水平研究疾病更具深远的意义。临床研究发现在不同疾病的不同发展阶段存在着某些蛋白质表达量有差异等现象,这无疑提示以此蛋白质作为一种疾病标志可用于疾病的早期诊断。另外,从免疫学角度,也可利用针对该蛋白质(抗原)的高亲和力抗体,根据抗原-抗体相结合的原理对某些疾病(如肿瘤)进行普查、高危人群的筛选和早期诊断,真正做到防患于未然。在药物开发方面,蛋白质组计划更是给药商提供了巨大的商业契机。目前已有公司或集团着手“药物靶”研制、开发,目的是使药物更具有针对性和提高疗效。
1995年,澳大利亚Williams和Wilkins首先提出了蛋白质组(proteome)概念,蛋白质组一词是由protein和genome两个词组合而来,意指“一个基因所表达的全部蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。早期定义为微生物基因组表达的整套蛋白质,在多细胞微生物中,整套蛋白质指一种组织或细胞表达的蛋白质。后来定义为一个基因组所表达的蛋白质。但是,从基因表达的角度来看,蛋白质组的蛋白质数目总是少于基因数目。从蛋白质修饰的角度来看,蛋白质组的蛋白质数却多于其相应开放阅读框架(open reading frame,ORF)数目,因为mRNA剪切和编辑可使一个ORF产生数种蛋白质,蛋白质翻译后的修饰,如糖基化、磷酸化,可以增加蛋白质的种类,氨基酸序列一致的一级结构在一定条件下可以形成功能完全不一样的具有不同空间结构的蛋白质,如朊病毒。现在的蛋白质组概念为一个基因组、一种生物或一种细胞或组织,在机体发育的某一时间所表达的全套蛋白质。而蛋白质组学则是指利用特定的方法研究蛋白质组、检测蛋白质表达,从而了解生命过程的精确机制以及基因表达调控的机制。