上QQ阅读APP看书,第一时间看更新
第四章 全基因组关联研究
不同个体之间约有99%的基因组DNA序列是相同的,因此人与人之间的差别仅归结于这1%的微小不同(不包括表观遗传学),而这1%的差别主要是单核苷酸多态(single nucleotide polymorphism,SNP)。在人类基因组中平均每500~1000个碱基对中就有1个SNP,占所有已知变异的90%以上。SNP数量多、分布广泛,被称为第三代遗传标记,比第一、二代遗传标记更适合于对复杂疾病遗传的解析和基于群体基因识别等方面的研究,并已取代微卫星标记技术进入基因研究应用的领域,与串联重复的微卫星位点相比具有高度稳定性。对SNP分析有助于解释个体的表型差异、不同群体和个体对疾病,特别是对复杂疾病的易感性、药物的耐受性和环境因子的反应等方面,研究成果已被广泛应用于分子诊断、临床检验、法医学、病原检测、遗传疾病和新药研发等。
为了研究SNP与疾病/性状易感性的关联,过去人们主要采用候选基因的策略(candidate gene approach),主要基于在疾病发生发展过程中已知的具有生物学功能的基因或通路,选择基因中位于编码区或调控区域的SNP进行关联研究,从而找出与疾病易感性相关的SNP。以肿瘤易感性的研究为例,研究较多的候选基因主要包括致癌物代谢酶基因 [1-3]、DNA损伤修复基因 [4,5]、针对感染原的免疫反应相关基因 [6]、细胞凋亡和周期调控相关基因 [7-9]等。而对于具体某个候选基因来说,位于基因启动子区或5'-非翻译区的SNP,可能通过影响转录因子结合位点的结合而影响该基因的转录活性;位于编码区的SNP有两种,同义SNP和非同义SNP,前者可能通过影响蛋白质的翻译效率,后者可能通过影响蛋白质的核酸组成,继而改变蛋白质的功能;位于3'-非翻译区等调控区段的SNP,可能调节基因mRNA的表达。虽然基于候选基因的生物学功能,筛选出感兴趣的候选SNP进行关联研究,从而发现与疾病或性状密切相关的易感SNP取得了巨大的成功,然而候选基因策略并不能全面而系统的研究基因组内全部SNP与疾病易感性的关联,不仅会遗漏基因组中重要的遗传信息,而且单个SNP的检测也耗费了巨大的样本资源。随着高通量分型技术的不断进步,以及人们对于人类基因组更全面的认识,候选基因法也逐渐被全基因组关联研究(Genomewide association study,GWAS)所取代。
GWAS是近几年刚刚发展起来的研究方法,目的是从人类全基因组范围内筛选出与复杂疾病表型关联的序列变异(主要是SNP),使我们有可能发现包括未知基因在内的与疾病表型相关的染色体区域或序列变异,进而了解人类复杂疾病的发病机制。自从2005年第一篇GWAS文章发表 [10]以来,各国科学家对肿瘤、糖尿病、心血管系统疾病、风湿病、皮肤病等复杂疾病以及身高、体质指数、血脂水平等复杂性状开展了一系列GWAS。根据美国国家人类基因组研究所(National Human Genome Research Institute,NHGRI)的统计,截至2012年12 月1日,共有1400余篇GWAS报道了8000余个与200多种疾病/性状相关的遗传位点,取得了令人瞩目的研究成果。
本章共分为四节,第一节介绍全基因组关联研究的背景和研究现状,第二节介绍全基因组关联研究的流程,第三节以我国肿瘤GWAS为代表,介绍GWAS的研究现状,最后一节展望未来全基因组关联研究的发展趋势。