上QQ阅读APP看书,第一时间看更新
第二节 基因表达及其调控
基因表达(gene expression)即从 DNA转录为RNA,以及mRNA翻译为蛋白质的过程。基因表达调控即指对基因表达的过程进行调节,是现代分子生物学研究的中心课题之一。在高等真核生物中,基因表达调控主要包括以下 6个方面:转录、前体RNA的加工和成熟、RNA出核及核糖体定位、RNA降解、翻译和翻译后修饰(图1-3)。基因表达的基本控制点是 RNA的转录起始,因此也可将上述6个环节分为转录调控和转录后调控两大调控方式。
图1-3 基因表达调控的主要环节
一、基因表达的转录调控
(一)染色质
染色质(chromatin)是指在细胞有丝分裂的间期,通常存在于细胞核内的、由遗传物质DNA、组蛋白、非组蛋白和少量RNA组成的,能够被碱性染料强烈着色的一种物质。真核细胞的线粒体和叶绿体有相对独立的DNA,通过与细胞核类似的机制在细胞器内完成基因表达过程。染色质的基本亚单元为核小体(nucleosome),每个核小体包含一段DNA超螺旋、由组蛋白(histone)H2A、H2B、H3、H4 各两分子组成的八聚体和位于八聚体外侧起联结作用的组蛋白H1分子。当DNA和组蛋白组装形成染色质时,组蛋白八聚体形成一个内核,在组蛋白八聚体内核当中,每个组蛋白通过其C端疏水性氨基酸相互结合,而N端带有正电荷的氨基酸则向四周延展,便于与 DNA分子的结合;DNA缠绕在组蛋白八聚体内核颗粒的表面,长度约为 147bp的DNA分子可缠绕组蛋白内核颗粒1.75圈;在两个相邻的核小体之间,组蛋白 H1与额外的20bp DNA分子结合,起到联结和稳定核小体的作用,形成“串珠”状结构,这种结构称为核丝(nucleofilament)或者多核小体链(polynucleosomal chain)(图1-4)。串联排列的核小体能够进一步螺旋化,压缩DNA。核小体和多核小体链的形成是染色质纤维压缩和解缩的结构基础。染色质按功能状态的不同可分为异染色质和常染色质。异染色质(heterochromatin)是指间期细胞核中,染色质纤维折叠压缩程度高,处于聚缩状态的染色质,而常染色质(euchromatin)是核小体发生构象变化,具有疏松结构的染色质。常染色质是构成染色质的主要成分,由于结构疏松处于伸展状态,便于转录调控因子与顺式调控元件的结合以及RNA聚合酶在转录模板上滑动。
图1-4 多核小体链
(二)转录调控基本元件
转录是遗传信息由DNA转换成RNA的过程,即以双链 DNA中的一条链为模板,ATP、CTP、GTP、UTP四种核苷三磷酸为原料,在多种酶的催化下合成RNA的过程。基因的转录起始包括一系列定义明确的步骤,由RNA聚合酶、顺式作用元件和反式作用因子(如转录因子)共同完成。RNA聚合酶(RNA polymerase)是以一条 DNA链或 RNA为模板催化由核苷-5′三磷酸合成RNA的酶。顺式作用元件(cis-acting element)指存在于 DNA分子上的一些与基因转录调控有关的特定调控序列,是反式作用因子(如转录因子)的结合位点。根据作用效果,顺式作用元件可以被分为:①正调控元件,即具有转录激活效应的元件;②负调控元件,即具有阻遏基因转录效应的元件。根据分布位置,顺式作用元件主要包括临近转录起始位点的启动子以及较远的增强子和沉默子。反式作用因子(trans-acting factor)是能与顺式作用元件相互作用,并调控基因转录表达的蛋白质因子,主要有转录因子和转录辅助因子(图1-5)。
图1-5 转录激活和转录抑制
启动子是最初结合RNA聚合酶的DNA序列。转录因子(transcription factor)是指能够结合到基因上游特异核苷酸序列(例如启动子)上对基因转录进行调控的蛋白质。在真核生物细胞中有三种不同的 RNA 聚合酶(PolⅠ、PolⅡ、PolⅢ),PolⅠ转录生成各种rRNA,PolⅢ转录产物是 tRNA、5s rRNA、snRNA,PolⅡ在核内主要负责转录 mRNA、大多数长链非编码RNA和微RNA。许多PolⅡ调控基因的启动子包含一个TATA元件,TATA元件由通用转录因子TFⅡD(transcription factor for PolⅡ)识别。TFⅡD是一个多亚基复合体,其中与TATA序列结合的成分称为 TBP(TATA binding protein)。TBP结合到 DNA上之后,TATA序列极大地扭曲变形并形成TBP-DNA复合体。该复合体随即将其他通用转录因子和RNA聚合酶本身募集到启动子上,共同组成前起始复合体,组装的顺序为:TFⅡA、TFⅡB、TFⅡF 与 RNA polⅡ一起结合于TBP-DNA复合体上,然后招募TFⅡE和TFⅡH形成前转录起始复合体。当前起始复合体形成后,启动子序列发生解旋,从而启动转录的发生。
许多肿瘤相关基因是转录因子,例如抑癌基因p53就是一种作用广泛的转录因子。p53蛋白由N端激活域(activation domain,AD)、中央 DNA 结合域(DNA binding domain,DBD)和 C端四聚体化域三个部分组成。p53的表达受细胞损伤刺激的诱导。p53被激活后通过其DBD结构域与下游靶基因启动子上特异性的DNA序列结合,激活靶基因转录,参与细胞周期调控、DNA修复、血管形成抑制、肿瘤转移抑制、细胞凋亡等生物学过程。p53是第二个被鉴定出的抑癌基因,高达50%以上的肿瘤中存在p53的基因突变,其中许多突变发生在p53的DBD结构域,导致p53对下游靶基因的调控异常,损伤的DNA不能得到及时修复,使得癌细胞增殖失控。
除了通用转录因子,还有一些协助RNA聚合酶与启动子结合或者促进已结合的RNA聚合酶提高转录速率的转录因子,这些转录因子被称为辅助转录因子(transcription co-factor),它们或间接募集聚合酶或在聚合酶结合后募集其他因子到启动子处调控基因转录。辅助转录因子包括能够激活转录的转录辅助激活因子(transcriptional co-activator)和抑制转录的转录辅助抑制因子(transcriptional corepressor)。最为人们熟知的转录辅助激活因子和转录辅助抑制因子分别是组蛋白乙酰转移酶和组蛋白去乙酰酶。组蛋白乙酰转移酶(histone acetyltransferase,HAT)是一类参与基因表达调控的重要蛋白质家族,催化底物蛋白质的乙酰化修饰过程。根据不同的生理学状况,组蛋白N端的赖氨酸会在乙酰化-去乙酰化之间转换,HATs催化乙酰基从乙酰辅酶A分子转移到组蛋白N端尾部的赖氨酸ε-氨基上,疏水的乙酰基使DNA与组蛋白间的静电引力和空间位阻增大,减弱了两者间的相互作用,使DNA易于解聚,有利于产生疏松结构的染色质,因此有利于转录因子与DNA模板相结合,激活基因转录。组蛋白去乙酰酶(histone deacetylase,HDAC)催化相反过程,使乙酰基从组蛋白分子上清除,染色质聚缩、沉默或者抑制靶基因转录。此外,HATs和 HDACs也可将非组蛋白作为底物,对这些底物蛋白的结构和功能进行调控。其中,发生在抑癌基因p53第320位和第373位赖氨酸的乙酰化是最为典型的案例之一。HATs和HDACs的动态平衡对于维持细胞正常的生长发育和内环境稳态十分重要,其基因突变或者活性失调与人类多种疾病的发生密切相关。
(三)染色质重塑与转录调控
染色质重塑(chromatin remodeling)是指染色质位置和结构的变化,染色质重塑改变了核小体在基因启动序列区域的排列,增加了基因转录装置和启动序列的可接近性。染色质重塑修饰方式主要包括两种:一种是由组蛋白修饰酶参与的化学修饰;另一种是依赖于ATP水解释放能量的染色质重塑复合物介导的过程。染色质重塑可以发生在DNA复制、转录、修复和重组等多个过程中,主要形式有核小体的丢失、组成成分置换及核小体与DNA链的相对滑动等变化。常见的染色质重塑复合物有SWI/SNF、ISWI、CHD 和 INO80四大家族。
(四)表观遗传与转录调控
1.表观遗传学的概念和内容
表观遗传学(epigenetics)这一术语最初由 Conad Waddingion提出,用于描述研究机体的遗传信息(基因型)与环境相互作用,最终产生可被观察到的特征(表型)的过程。历经发展之后,在 2008年的一次Cold Spring Harbor会议上,表观遗传学被明确定义为“描述不涉及DNA序列变化的,但可通过细胞谱系的后代遗传下去的基因组功能的改变”。
表观遗传涉及的内容很多,主要有DNA甲基化、组蛋白修饰、染色质重塑、RNA干扰、RNA修饰、RNA编辑和非编码RNA等。其中一些内容与前面介绍的传统转录调控研究有交叉,例如组蛋白修饰和染色质重塑等。表观遗传因子与转录因子在细胞命运决定中的作用是相辅相成的,二者之间既有协同,也有抑制。表观遗传学和非编码RNA领域的迅速发展,增加了我们对基因表达调控的认识,是对传统的遗传调控和蛋白质编码基因功能的重要补充。
2.表观遗传因子
一个基因的活性与其载体染色质的状态密切相关。当染色质的结构处于伸展状态,DNA处于一种相对裸露状态,便于转录调控因子和RNA聚合酶的识别,基因转录启动。反之,染色质聚缩,转录抑制。表观遗传因子(epigenetic factor)调控所产生的表观标记(epigenetic marker),不仅影响转录因子与顺式作用元件的结合,而且对染色质的结构发挥动态调控。其中通过酶促反应,在组蛋白和DNA上添加修饰的表观遗传因子被称为“修饰酶(writer)”,包括前面介绍的 HATs以及组蛋白甲基化酶、DNA甲基化酶等。相对应的,通过酶促反应将组蛋白和DNA上的修饰去除的表观遗传因子被称为“去修饰酶(eraser)”,包括前面介绍的HDACs以及组蛋白去甲基化酶、DNA去甲基化酶等。还有一组表观遗传因子,它们不具有酶的活性,但是能够识别组蛋白和DNA上的修饰,介导下游的转录过程,被称为“识别因子(reader)”(表1-1)。下面就研究较多的几种表观遗传学现象在转录调控和转录后调控中的作用进行介绍,包括DNA甲基化和去甲基化、组蛋白修饰、非编码RNA和RNA修饰。
表1-1 常见的表观因子
3.DNA甲基化和去甲基化
DNA甲基化(DNA methylation)是指DNA分子被甲基基团修饰的过程。DNA甲基化是在不改变DNA序列情况下,对DNA转录发挥调控,并且能够遗传,因此属于表观遗传学范畴。DNA甲基化可作用于胞嘧啶(C)和鸟嘌呤(G)上,其中发生在胞嘧啶第5位碳原子上的甲基化(5-甲基胞嘧啶,5-methylcytosine,5-mC)是真核生物中最主要的DNA甲基化方式。5-mC被认为是哺乳动物基因组中除腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)及鸟嘌呤(G)之外的第五种碱基,由DNA甲基转移酶(DNA methyltransferase,DNMT)将 S-腺苷甲硫氨酸(SAM)的甲基基团转移到胞嘧啶 5位碳原子上而完成(图1-6)。在成人的组织器官中,DNA中3%~6%的胞嘧啶是被甲基化的。在基因组上,这些具有被甲基化的潜力的胞嘧啶不是随机分布在基因组中的,而是存在于富含胞嘧啶和鸟嘌呤二核苷酸的区域,这个区域被称为 CpG岛(CpG islands),主要集中在基因5′端的非编码区,并成簇存在。在甲基转移酶的催化下,DNA的 CpG中的胞嘧啶被选择性地添加甲基,形成 5-mC。DNA甲基化导致邻近区域DNA构象变化,从而影响了蛋白质与DNA的相互作用,甲基化达到一定程度时会发生从常规的B-DNA向Z-DNA结构的过渡,由于Z-DNA结构收缩,螺旋加深,使许多蛋白质因子赖以结合的元件缩入大沟而不利于转录的起始,导致基因失活。另外,序列特异性甲基化结合蛋白(MBD/MeCP2)可与启动子区的甲基化CpG岛结合,阻止转录因子与启动子作用,从而抑制基因转录过程。动物中DNA甲基转移酶有两种:①从头甲基转移酶(DN-MT3a、DNMT3b):识别两条链均未甲基化的DNA,完全不以亲代DNA甲基化状态为模板进行的DNA甲基化。从头甲基转移酶参与细胞生长分化调控,其中DNMT3b在肿瘤基因甲基化中起重要作用。②持续性DNA甲基转移酶(DNMT1):双链DNA的其中一条链已存在甲基化的状态下,DNMT1作用于另一条的未甲基化的链,使其完全甲基化,可参与DNA复制双链中的新合成链的甲基化,DNMT1还可直接与组蛋白去乙酰基转移酶(HDAC)联合作用阻断转录;DNA甲基化可以跨越细胞分裂遗传给子代细胞。细胞分裂后,完全甲基化的DNA双链会一分为二进入子代细胞,这时维持甲基化酶(maintenance methylases)能够极其有效地修饰半甲基化的DNA(即完全甲基化DNA经复制后提供的底物),它们随后可以被抑制子MeCP2所识别,后者募集组蛋白去乙酰酶和甲基化酶,重新建立沉默。
图1-6 DNA甲基化
去甲基化(DNA demethylation)是将 DNA 上的甲基化修饰去除的过程。与DNA甲基化作用相反,当CpG岛处于去甲基化状态时,基因转录被激活。在体内和体外的多种重编程过程中,DNA甲基化的去除对于全能性基因的激活和组蛋白修饰的重建十分重要。DNA去甲基化有被动途径和主动途径两种方式。被动去甲基化(passive demethylation)是指当DNMTs活性被抑制或浓度过低时,无法维持原有的甲基化状态,使DNA甲基化程度降低的过程。主动去甲基化(active demethylation)是经去甲基酶的作用,将甲基基团移去的过程。由于DNA主动去甲基化过程的时间窗口较短、细胞来源有限以及纯化难等困难,寻找DNA去甲基化酶一直是表观遗传领域的一个难点。2009年,DNA双加氧酶 TET1(ten eleven translocation1)蛋白被证实在体外具有将5-mC氧化成5-羟甲基胞嘧啶(5-hydroxymethyl cytosine,5hmC)的作用,是第一个被证实的哺乳动物DNA去甲基化酶。尽管目前对哺乳动物DNA去甲基化的完整过程还没有得到全面解析,研究认为DNA主动去甲基化的过程首先依赖于TET家族的氧化活性,将5-mC顺序氧化为5hmC-5fc(5-醛基胞嘧啶,5-formylcytosine)-5caC(5-羧基胞嘧啶,被称为第 7种碱基);继而胸腺嘧啶DNA糖苷酶(TDG)能够特异性识别5caC,并通过碱基切除修复途径(base excision repair,BER)将 5caC从基因组中切除,最终转化成非甲基化的胞嘧啶(C)。
哺乳动物一生中DNA甲基化水平经历两次显著变化,第一次发生在受精卵最初几次卵裂中,去甲基化酶清除了DNA分子上几乎所有从亲代遗传来的甲基化标志;第二次发生在胚胎植入子宫时,甲基化酶使DNA重新建立一个新的甲基化模式。细胞内新的甲基化模式一旦建成,即可通过“甲基化维持”的形式将新的DNA甲基化状态传递给所有子细胞DNA分子。在正常体细胞中,这种DNA甲基化状态能够抑制染色体不稳定以及由内部序列的再激活引起的基因错乱,从而起到保护染色体完整性的作用。相反地,如在肿瘤病变时,往往产生基因组的低甲基化及特定启动子的局部高甲基化。DNA甲基化通过调节基因印记、转录、X染色体失活等生命活动,在胚胎发育、细胞分化和疾病发生发展上发挥重要作用。
4.组蛋白修饰
组蛋白修饰(histone modification)指通过酶在组蛋白上增加或去除小的化学基团。组蛋白是染色质的主要成分,各种组蛋白修饰之间存在着相互作用。2001年提出的“组蛋白密码”假说(histone code hypothesis),认为在一定程度上DNA转录被化学修饰的组蛋白所调节,与DNA甲基化共同组成表观遗传密码的重要内容。组蛋白修饰类型包括组蛋白的乙酰化/去乙酰化、甲基化/去甲基化、泛素化/去泛素化、磷酸化、小泛素相关修饰物(SUMO)化等。修饰多发生在组蛋白N端。
在众多的组蛋白修饰中,对乙酰化作用的研究最为深入,已在前面介绍。组蛋白甲基化修饰是另外一种研究较为深入的组蛋白修饰。组蛋白的甲基化和去甲基化分别由甲基化酶和去甲基化酶催化完成,主要发生在赖氨酸(K)和精氨酸(R)残基上。常见的组蛋白甲基化修饰发生在 H3第4位、9位、27位、36位、79位赖氨酸残基(H3K4、H3K9、H3K27、H3K36、H3K79),以及组蛋白 H4的第 20位赖氨酸残基(H4K20)。在体内,赖氨酸甲基化有三种状态:单甲基化、二甲基化和三甲基化。甲基化N-CH3键有较高的热力学稳定性,组蛋白甲基化是否可逆曾是该领域争论的一个焦点。直到2004年第一个组蛋白去甲基化酶——LSD1(lysine specific demethylase)的发现,证明了组蛋白甲基化同样是可逆的动态变化过程。LSD1属于单胺氧化酶家族,反应过程中需要ε-N原子上一个额外质子的参与,因此LSD1的去甲基活性具有底物特异性,仅能作用于单甲基化 H3K4m1和二甲基化 H3K4m2,而不能以三甲基化 H3K4m3为底物进行反应。目前认为,H3K4、H3K36、H3K79甲基化修饰介导基因转录活化,标记有活性的常染色体;而 H3K9、H3K27、H4K20甲基化修饰介导转录抑制,往往处于沉默的异染色质上。
组蛋白磷酸化(histone phosphorylation)是指对组蛋白N端氨基酸残基进行的磷酸化修饰的一种组蛋白修饰方式。目前认为磷酸化能够破坏组蛋白与DNA间的相互作用,从而使染色体结构趋于不稳定的状态,使染色质在细胞分裂时凝集成为同源染色体。组蛋白磷酸化的另一个重要功能与DNA损伤修复有关,H2A的变体 H2AX丝氨酸139上的磷酸化与DNA损伤,尤其是涉及DNA双链结构断裂的损伤有关。丝氨酸139磷酸化的H2AX称为γ-H2AX,作为DNA双链损伤感应的起始信号分子,可以与 BRCA1、53BP1、MDC1、MRN复合体和Rad51共定位于DNA双链结构断裂处,执行一系列细胞损伤修复反应。
组蛋白泛素化(histone ubiquitination)指组蛋白被泛素(ubiquitin)共价修饰的过程。泛素化修饰就是底物的赖氨酸残疾位点与泛素分子的羧基末端相互结合的过程。由于泛素本身的7个赖氨酸位点也可与另一个泛素相结合,因此单泛素化的底物蛋白还可以结合多个泛素,形成多泛素化修饰。组蛋白H2A的泛素化修饰于1975年被首次发现,其泛素化修饰位点是高度保守的赖氨酸119位点。研究发现,组蛋白H2A的泛素化能够促进组蛋白H1与核小体的结合,促进多聚梳群蛋白的沉默,还在 X染色体失活的起始过程中有重要作用。除了 H2A以外,组蛋白H2B也可以被泛素化修饰。尽管染色质中泛素化的组蛋白 H2B量并不多,约占 1%~2%,但是在真核生物中广泛分布。研究发现组蛋白H3K4m2或H3K4m3需要 H2B的赖氨酸123的泛素化,说明一个组蛋白亚单位的修饰能够调控另一个不同亚单位的修饰;由于H3K4的甲基化能够导致端粒附近基因的沉默,因此H2B的甲基化能够间接调控基因的沉默。此外,组蛋白H2B的泛素化与去泛素化的循环与转录起始及延伸有密切关系。另外,核心组蛋白的变异体也发现有泛素化修饰。相比较而言,组蛋白H3和H1的泛素化形式比H2A,H2B少。
5.长链非编码RNA与转录调控
一直以来,人们认为蛋白质是调控细胞功能活动的主体。近年来的研究发现,除被人们熟知的tRNA和rRNA这些结构性非编码 RNA外,从细菌到人的各种生物中均存在数量不等的调控性非编码RNA。这些调控性非编码RNA(regulatory noncoding RNA)通常不作为进一步翻译为蛋白质的模板,而是以RNA的形式发挥着调控功能。2010年 12月 Science杂志在评选21世纪第一个 10年的十大科学突破时,将RNA研究列为第一项,对非编码RNA领域研究的重要性给予了充分肯定。广义而言,非编码RNA由于不改变生物体的遗传信息(基因型),因此也属于表观遗传学的范畴。在哺乳动物中,长链非编码RNA和微RNA分别是转录调控和转录后调控的非编码RNA代表。
长链非编码 RNA(long noncoding RNA,lncRNA)目前的定义为长度大于200个核苷酸的、无明显蛋白编码功能的非编码RNA分子。lncRNAs是在基因组中所占比例随着进化程度由简到繁表现出飞跃式增加,提示lncRNA形成与一些精细繁杂调控功能相关。根据在基因组上的产生部位,可分为反义lncRNA(antisense lncRNA)、内含子 lncRNA(intronic lncRNA)、基因间 lncRNA(intergenic lncRNA,lincRNA)、增强子 lncRNA(enhancer RNA eRNA)和启动子 lncRNA(promoter RNA pRNA)等。lncRNA的数量众多,截至2016年底,最新的 lncRNA数据库NONCODE录入了141 353条人的和117 405条鼠的lncRNA。而随着二代测序技术的深入,lncRNA的数量仍在继续攀升。在结构上,lncRNA与mRNA十分相似,然而lncRNA中不具有内含子序列的比例较高,一些lncRNA还被发现不具有典型的5′帽子和(或)3′poly(A)尾结构。
LncRNA的作用机制复杂多样,可以在转录及转录后等多个层面发挥调控功能。目前认为,lncRNA主要定位于细胞核,影响转录调控是其发挥功能最主要的一种方式。从作用效果上,lncRNA在基因转录调控中发挥作用的方式主要有以下3种(图1-7):①向导 RNA。此类 lncRNA分子以与 X染色体失活相关 lncRNA-XIST为代表,这些lncRNA能够结合反式作用因子,并将后者招募到靶基因的顺式作用元件上进行基因表达调控。②分子诱饵:与向导RNA类似,此类lncRNA也具有结合反式作用因子的能力。然而不同的是,这种RNA-蛋白质结合是竞争性地抑制反式作用因子与靶基因的顺式作用元件的结合,行使类似分子诱饵的功能,因而得名。③分子支架。以 HOTAIR为代表,HOTAIR就像一个支架,两端分别结合表观调控因子 PRC2和LSD1复合物,将数个重要的分子原件通过枷锁形式组装起来发挥功能。
图1-7 lncRNA在基因转录调控中的主要作用方式
二、转录后调控
(一)转录后调控
基因转录的产物为前体RNA。前体RNA通常不具有生物学活性,需经一系列的加工处理后才能转变为具有功能的成熟RNA,发挥生物学功能(非编码RNA)或者进一步翻译为蛋白质。转录后调控主要包括RNA的加工与剪接、蛋白质的翻译和翻译后修饰等。详细内容请参考“第二章 蛋白质代谢失调”。
(二)微RNA与转录后调控
微RNA(micro RNA,miRNA)是一类由内源基因编码的、长度约为20~25个核苷酸的单链非编码RNA分子。第一个被确认的miRNA分子是1993年被报道的线虫lin-4,7年后在线虫中发现了第二个miRNA分子let-7,并揭示miRNA调控基因表达是一个普遍的现象,将miRNA领域的研究引领到一个新的高度。目前认为,大多数miRNA首先在核内由RNA聚合酶Ⅱ转录生成长度约为300~1000个核苷酸的primary-miRNA(pri-miRNA)。pri-miRNA 在核酸酶Drosha复合体及其辅助因子Pasha的作用下被剪切成 70个核苷酸左右的 precursor-miRNA(premiRNA)。pre-miRNA在Exportin5的辅助下离开细胞核进入细胞质中,随后被另一个核酸酶Dicer复合体剪切成约22个核苷酸长度的miRNA:miRNA双链。这种双链迅速被进入RNA诱导沉默复合体(RNA-induced silencing complex,RISC)中,其中一条成熟的单链miRNA保留在该复合体中。成熟的miRNA能够与靶标mRNA上序列互补的位点结合(完全或不完全配对),参与靶基因的表达调控(图1-8)。少数 miRNA(如 miRNA-320家族成员)不接受Drosha剪切,只接受 Dicer剪切产生 pre-miRNA,这类miRNA被称为“非传统miRNA(non-canonical miRNA)”,以区别于受Drosha和Dicer双步剪切的传统 miRNA(canonical miRNA)。
图1-8 经典的miRNA成熟途径
在基因的表达调控中,miRNA被人们熟知的功能是抑制靶基因的表达和稳定性。根据与靶基因结合序列的互补程度,miRNA主要有2种作用方式:当miRNA的种子区域(Seed区,指 miRNA 5′端第二位到第八位之间的序列)与靶基因mRNA 3′非编码区(3′UTR)不完全配对时,往往抑制翻译过程,进而抑制蛋白质的合成,线虫lin-4就是以这种方式参与基因表达调控,这是miRNA首先被发现的作用方式;而当miRNA种子区域与靶基因mRNA 3′非编码区完全配对(或者几乎完全互补)时,miRNA能够切割靶基因,进而降解靶标mRNA,这种现象在植物中较为普遍。近年来的研究发现,除传统的3′UTR区域外,miRNA 也可与 5′非编码区(5′UTR),甚至编码区序列结合进而调节靶标的基因表达,这种结合方式可能反而能够增加靶标mRNA的稳定性。
miRNA在动植物中广泛表达,容易成簇出现于染色体上。由于受到生物技术灵敏度和基因组交叉保护等多种限制,有关miRNA的确切数目还不十分确定。在公共数据库中,人类基因组中大约有1900处被确认能够产生 miRNA,这个数字随着miRNA研究的深入正在继续加大。传统上认为多数miRNA具有高度保守性和时空表达特异性,而新发现的许多miRNA也存在着较强的人类和灵长类组织特异性。miRNA与其靶标之间的关系不是一对一的,每个miRNA可以有多个靶基因,而几个miRNA也可以共同调节一个基因。miRNAs可能代表在一个新发现的层次上的基因表达调控方式。
尽管绝大多数miRNA的功能仍有待于更深入的研究,通过对基因组上miRNA的位点分析和大量的研究表明,miRNA在细胞分化,生物发育及疾病发生发展过程中发挥重要作用,一些 miRNA的生物学功能以及与人类疾病的关系已经得到初步阐明。例如,作为在人类组织中被发现的第一个miRNA分子,let-7的异常调控能够导致癌症的发生。对miRNA研究的逐步深入,将会使人们对于高等真核生物基因表达调控网络的理解提供新的补充,也有可能为人类疾病的诊断和治疗提供一种新的手段。
(三)RNA修饰与转录后调控
除RNA首尾末端发生的5′端的甲基化“帽子”和3′端的poly(A)尾外,在RNA内部同样存在着化学修饰。据估计,RNA内部修饰有约百种。目前研究仅限于个别常见的修饰,对大多数的 RNA修饰的了解十分匮乏。6-甲基腺嘌呤(N6-methyladenosine,m6A)是 mRNA分子上腺嘌呤第 6位 N原子的甲基化修饰(图1-9)。它是mRNA最主要的一种内部修饰,平均每个mRNA上有3~5个,在mRNA的稳定性及下游蛋白质翻译过程、剪接加工上均发挥重要作用。m6A也是一种动态可逆的调节过程,分别由 m6A甲基转移酶(Mettl3和Mettl14)、YTH家族蛋白和m6A去甲基转移酶(脂肪含量与肥胖相关基因Fto和Alkbh5)介导修饰、识别和去修饰过程。参与m6A修饰过程的蛋白质与人类疾病之间存在密切关系。Mettl3功能缺失会广泛引发人类细胞中基因表达谱和可变剪接变化以及细胞凋亡。其基因敲除小鼠的胚胎干细胞趋向于保持原始态多能性,丧失分化能力。而 Fto和Alkbh5基因敲除小鼠均出现发育失常、能量内稳态紊乱和小鼠不育等疾病。RNA甲基化是独立于DNA序列的表观遗传学作用形式,与DNA、组蛋白的表观遗传学修饰存在许多共同之处。RNA甲基化的可逆性这一新发现使人们认识到中心法则中的三大成员都存在着可逆性的化学修饰。DNA和组蛋白的表观遗传学修饰主要在转录水平上起作用,RNA甲基化主要在转录后水平上调控基因表达,这个新兴领域目前也正在得到迅速的拓展。
图1-9 m6A甲基化与去甲基化过程