第二节 RNA的结构和功能
DNA是遗传物质,其直接作用是指导合成RNA。结构上RNA与DNA明显不同之处是其几乎都呈单链状态。单链结构赋予RNA结构复杂性和功能多样性。RNA是唯一既可储存和传递遗传信息,又有催化活性的大分子,因而被推测为地球上最早出现的生命物质。核酶的发现也改变了酶的传统定义,即不限于蛋白质。
生物体内核酸都与蛋白质形成核蛋白(nucleoprotein),其中RNA形成的核蛋白称为核糖[核酸]核蛋白(ribonucleoprotein,RNP),有些RNP结构极其复杂,其RNA成分有的起结构作用,有的起催化作用。
一、RNA组成
RNA由四种核苷酸通过3',5'-磷酸二酯键连接形成,与DNA有以下不同。
1.组成RNA的核苷酸含核糖而不含脱氧核糖,含尿嘧啶(U)而几乎不含胸腺嘧啶(T)。因此,组成RNA的四种常规核苷酸是一磷酸腺苷(AMP)、一磷酸鸟苷(GMP)、一磷酸胞苷(CMP)和一磷酸尿苷(UMP)。
2. RNA含较多的稀有碱基(unusual base,minor base),各种稀有碱基几乎都有其特殊功能。
3. RNA有较多2'-O-甲基核糖。
二、RNA结构
绝大多数RNA为线性单链结构,其构象少有DNA那样典型的双螺旋结构,但有以下特征。
1.线性单链RNA形成右手螺旋结构。
2. RNA分子中某些片段具有序列互补性,因而可通过自身回折形成茎环结构(即发夹结构)。茎环结构由一段短的互补双链区(茎,又称臂)和一个有特定构象和功能的单链环构成(图1-10),互补双链区碱基配对原则是A对U、G对C,但可含非Watson-Crick碱基配对,特别是G-U碱基对,例如rRNA富含G-U、G-A碱基对。互补双链区可形成右手双螺旋结构。
图1-10 RNA的茎环结构
3.各种RNA三级结构复杂,直接决定其生理功能。
三、RNA分类
人体一个细胞约含10pg RNA(约含7pg DNA)。与DNA相比,RNA种类繁多,分子量较小,含量变化大。RNA可根据结构和功能的不同分为信使RNA和非编码RNA。非编码RNA可根据组织特异性和水平稳定性及编码基因不同分为管家RNA(housekeeping RNA,组成[性]非编码RNA)和调控RNA(调节RNA,regulatory RNA,调控[性]非编码RNA);也可根据大小分为非编码大RNA(large noncoding RNA)和非编码小RNA(small noncoding RNA,sncRNA,<200nt;nt,nucleotide,用作单链核酸长度单位,较短的也用mer)(表1-2);还可根据分子长度、结构特征、分子伴侣、亚细胞定位等综合分类(表1-3)。
表1-2 非编码RNA分类
续表
表1-3 人非编码RNA一览
人体内已有23000种功能RNA被鉴定。
(一)信使RNA
信使RNA(mRNA)最早发现于1960年,在蛋白质合成过程中负责传递遗传信息、直接编码一条或几条肽链,具有以下特点(结构特点见第四章,99页)。
1.含量低 占细胞总RNA的1%~5%。不同RNA含量不一,可相差104倍。
2.种类多 可达105种。不同基因编码不同的mRNA。
3.寿命短 mRNA指导合成蛋白质,合成完毕即被降解。细菌mRNA的平均半衰期(又称半寿期)约为1.5分钟。脊椎动物mRNA半衰期长短不一,平均约为3小时。
4.长度差异大 细菌mRNA平均长度1.2×103nt,不同真核生物mRNA平均长度1×103~ 3×103nt,哺乳动物mRNA长度5×102~1×105nt。
原核生物和真核生物的mRNA虽然有结构差异,但功能一样,均为指导蛋白质合成的模板(第四章,99页)。
(二)转运RNA
转运RNA(转移RNA,tRNA)在蛋白质合成过程中的作用是负载氨基酸、解读mRNA遗传密码。tRNA占细胞总RNA的10%~15%,绝大多数位于细胞质中。tRNA由F. Crick于1955年提出其存在,P. Zamecnik和M. Hoagland于1957年鉴定,R. Holley于1965年完成了酵母丙氨酸tRNA(tRNAAla)测序(第一种被测序的核酸分子)。以下介绍细胞质tRNA。线粒体、叶绿体有自己的tRNA,它们都比细胞质tRNA小。
1. tRNA一级结构 ①是一类单链小分子RNA,长73~95nt(共有序列76nt),沉降系数4S。②是含稀有碱基最多的RNA,含7~15个稀有碱基(占全部碱基的15%~20%),位于非碱基对区。③5'末端多为5'-GMP。④3'端均为CCA序列,其中的AMP常称为A76,其3'-羟基是氨基酸结合位点。
tRNA稀有碱基中有些是A、U、C、G的甲基化、二甲基化修饰物。甲基化有些是为了避免配对错误,有些赋予tRNA局部疏水性,以便与氨酰tRNA合成酶或核糖体结合。
2. tRNA二级结构 约50%碱基配对,形成四段双螺旋臂(arm,stem,类似于A-DNA),与五段非配对序列形成三叶草形结构(图1-11①):①氨基酸臂(amino acid arm)长7bp。②二氢尿嘧啶臂(D arm,D[HU]臂)长4bp(个别3bp),末端有二氢尿嘧啶环(D[HU]环),特征是含2或3个二氢尿嘧啶(D[HU])。③反密码子臂(anticodon arm)长5bp,末端有7nt反密码子环,中间3nt组成反密码子(第四章,102页)。反密码子5'端与尿苷酸连接,3'端与嘌呤核苷酸连接。④TΨC臂(TΨC arm,T臂)长5bp,末端有TΨC环(Ψ环),特征是TΨC环含胸腺嘧啶核糖核苷T54-假尿苷Ψ55-胞苷C56。⑤额外臂(extra arm,可变臂,variable arm)长3~21nt,仅较大的tRNA含有。
图1-11 tRNA结构
3. tRNA三级结构 呈扭曲的L形,氨基酸结合位点位于其一端,反密码子环位于其另一端,DHU环和TΨC环虽然在二级结构中位于两侧,但在三级结构中却相邻(图1-11②)。
尽管各种tRNA的长度和序列不尽相同,但其三级结构相似,提示三级结构与其功能密切相关。
(三)核糖体RNA
核糖体RNA(rRNA)与核糖体蛋白(r-protein)构成核糖体(ribosome),一个大肠杆菌约有15000个核糖体。
1.核糖体组成和结构 原核生物和真核生物的核糖体均由一个大亚基和一个小亚基构成,两个亚基均由rRNA和核糖体蛋白构成。它们的大小一般用沉降系数(S)表示(表1-4)。
表1-4 核糖体组成
(1)初期研究认为大肠杆菌核糖体大亚基(又称50S亚基)有36条肽链,编号L1~L36。进一步研究表明:①L7是L12的Ser2乙酰化产物。②L26是小亚基(又称30S亚基)蛋白质S20,并不是大亚基蛋白质。③L8是两个L7/L12二聚体与L10形成的五聚体。因此,目前认为大肠杆菌核糖体大亚基含有33种基因编码的36条肽链。
(2)真核生物18S、28S、5S rRNA分别与原核生物16S、23S、5S rRNA同源,5.8S rRNA与23S rRNA 5'端同源。
(3)核糖体与核糖体亚基形成解离平衡,Mg2+抑制解离。
2.核糖体RNA特点 ①含量高:rRNA是细胞内含量最高的RNA,占细胞总RNA的80%~85%。②寿命长:rRNA更新慢,寿命长。③种类少:原核生物有5S、16S、23S三种rRNA,约占核糖体质量的66%(其中5S、23S rRNA占核糖体大亚基质量的70%,16S rRNA占核糖体小亚基质量的60%);真核生物主要有5S、5.8S、18S、28S四种rRNA,另有少量线粒体rRNA、叶绿体rRNA。
大肠杆菌16S rRNA的3'端有一段保守序列ACCUCCU,可与mRNA中的SD序列互补结合(共有序列AGGAGGU,第四章,107页)。5S rRNA有两段保守序列:①CGAAC,可以与tRNA的TΨC环的GTΨCG互补结合。②GCGCCGAAUGGUAGU,可以与23S rRNA中的一段序列互补结合。
3.核糖体种类 原核生物只有一类核糖体,真核生物则有位于细胞不同部位的以下几类核糖体:游离核糖体、内质网核糖体(又称附着核糖体)、线粒体核糖体和叶绿体核糖体(植物)。游离核糖体和内质网核糖体实际上是同一类核糖体,它们比原核生物核糖体大,所含的rRNA和蛋白质也多。线粒体核糖体和叶绿体核糖体比原核生物核糖体小。这些核糖体的基本结构和功能一致。
(四)核酶
科学家在研究RNA的转录后加工时发现某些RNA有催化活性,可以催化RNA的剪接,这些由活细胞合成、起催化作用的RNA称为核酶(ribozyme,RNA酶,RNA enzyme)。许多核酶的底物也是RNA,甚至就是其自身,其催化反应具有专一性。
已阐明的天然核酶有锤头状核酶(斧头状核酶)、发夹状核酶、Ⅰ型内含子、Ⅱ型内含子、丁型肝炎病毒核酶、核糖核酸酶P(RNase P)、肽酰转移酶(23S rRNA)等。
如何评价核酶的理论意义与实际意义,如何看待核酶与传统意义上的蛋白质酶在代谢中的地位,都有待进一步研究。
1.核酶发现 核酶最早由T. Cech和S. Altman(1989年诺贝尔化学奖获得者)发现。1967年,C. Woese、F. Crick与L. Orgel等基于RNA二级结构的复杂程度提出其可能有催化活性;1982年,T. Cech团队在研究单细胞真核生物四膜虫rRNA前体剪接时(从6.4kb中剪除413nt,得到26S rRNA)发现其内含子有自我剪接活性;1983年,S. Altman在研究细菌tRNA前体时发现RNase P中的M1 RNA参与tRNA前体转录后加工;1982年,K. Kruger等建议将有催化活性的RNA命名为“ribozyme(核酶)”。迄今已发现超过1500种这类内含子,广泛存在于真核生物甚至细菌中(但脊椎动物无),统称Ⅰ型内含子(大多数需要自我剪接)。
2.Ⅰ型内含子自我剪接机制 Ⅰ型内含子含一段内部指导序列(internal guide sequence)与上游外显子3'末端序列形成双链结构,并使其定向靠近下游外显子5'末端。①鸟苷(或GMP、GDP、GTP)作为辅助因子先结合于RNA的G结合位点。②鸟苷3'-羟基亲核攻击内含子5'剪接位点磷酸基,使上游外显子3'-羟基游离。③上游外显子3'-羟基亲核攻击内含子3'剪接位点,释放Ⅰ型内含子(413nt)(图1-12)。
图1-12 Ⅰ型内含子自我剪接机制
3.核酶特点 到目前为止鉴定的各种核酶有以下特点。
(1)化学本质为RNA或RNA片段。有些核糖核蛋白也有催化作用,但活性中心位于其蛋白质成分上,并不属于核酶,例如端粒酶。然而,如果核糖核蛋白的RNA含活性中心,则该RNA组分是核酶,例如RNase P所含的M1 RNA(第三章,82页)。
(2)底物种类比较少,大多数是自身RNA或其他RNA分子,并因此将核酶分为自体催化、异体催化两类。此外还有其他底物,例如核糖体肽酰转移酶的底物是氨酰tRNA和肽酰tRNA(第四章,104页)。
(3)催化效率比蛋白质酶低得多。
(4)具有专一性。例如,M1 RNA只切割tRNA前体5'端的额外核苷酸(extranucleotides,第三章,91页),不切割其3'端的额外核苷酸及其他序列。
(5)均催化不可逆反应。
(6)催化反应时需要Mg2+,Mg2+既维持其活性构象,又参与催化反应。
(7)多数核酶在细胞内含量极低。
4.核酶意义 ①使我们对RNA的生理功能有了进一步的认识,即它既是遗传信息载体,又是生物催化剂,兼有DNA和蛋白质两类生物大分子的功能。②纠正了所有生物催化剂均为蛋白质的传统认知。③对于了解分子进化具有重要意义,RNA或许是先于DNA和蛋白质出现的生物大分子。
5.核酶应用 ①基因治疗(第十五章,369页);②特定RNA降解;③生物传感器;④功能基因组学;⑤基因发现。