第二节 麻疹病毒结构基因和编码蛋白
麻疹病毒包含6个结构基因,编码8个蛋白,在负链上的基因排列顺序为3′-N-P/V/C-M-F-H-L-5′[3],如图2-1所示。不分节段的RNA基因组上包含6个结构基因,N、M、F、H和L基因各自编码一种对应蛋白,而P基因编码P、V、C三种蛋白。P蛋白和C蛋白是由双顺反子mRNA上的重叠阅读框翻译而来,V蛋白是从V mRNA翻译而来。V mRNA通过RNA编辑在P基因的691位插入了一个G碱基。
图2-1 麻疹病毒的基因组结构图
注:麻疹病毒16kb的负链RNA共含有6个结构基因,N、M、F、H和L基因各自编码一种对应蛋白,而P基因编码P、V、C三种蛋白,V蛋白mRNA通过RNA编辑在P基因的691位插入了一个G碱基
(图片来源:Yanagi,et al.J Gen Virol,2006,87(10):2767)
麻疹病毒的6种结构蛋白在病毒粒中的相应位置如图2-2所示。核蛋白N与病毒基因组RNA 3′端起始序列结合,形成核蛋白多聚体,作为核衣壳保护病毒RNA;RNA聚合酶L与磷酸化蛋白P的特定区域结合,并在基因组3′端起始序列形成以P蛋白为中介的N-P-L结构,起始复制和转录;膜蛋白M附着在外膜内侧形成病毒外膜的内层,维持病毒颗粒的完整;F和H蛋白嵌在外膜上形成刺突,为糖基化膜蛋白,H蛋白和细胞表面的MV受体相结合吸附到细胞上,并与F蛋白共同作用,诱导病毒外膜和细胞膜的融合使病毒感染宿主细胞。麻疹病毒的致病性、免疫原性等重要生物学活性都取决于H和F蛋白的结构和功能。V和C为非结构蛋白,目前对之认识较少,有研究认为可能与病毒传染的细胞应答调整和干扰素信号调节有关。
一、结构基因及编码蛋白
(一)N基因及其编码蛋白
N基因全长为1689nt(nt56-nt1744),其中编码区由1578nt(nt108-nt1685)组成,编码525个氨基酸,其编码的N蛋白分子质量为60kDa。N蛋白是MV的主要蛋白,它与病毒的基因组RNA结合,以磷酸化形式存在。麻疹病毒N基因3′端包含了56bp的前导序列,是N蛋白的结合部位,在该序列中有约14bp长的序列可与宿主细胞质中的蛋白因子特异结合,形成抗RNase的复合物。N蛋白是MV在复制过程中第一个得到表达,且含量最丰富的蛋白质。该蛋白与病毒基因组RNA 3′端起始序列结合,形成核蛋白多聚体,L蛋白和P蛋白特定区域结合,并在基因组3′端起始序列形成以P蛋白为中介的N-P-L结构,起始复制和转录。N基因C末端450个核苷酸是MV基因变异最大的区域,在不同的麻疹野病毒之间变异程度可达12%,而且这一段序列在体外培养中相对比较稳定,在不同猴细胞系(vero或B95a)或人类细胞系(BJAB)上适应生长未发生改变[5]。因此N基因是国际上公认的MV基因型鉴定的重要指标。
图2-2 麻疹病毒结构图
注:麻疹病毒含有6种蛋白:2种表面糖蛋白,血凝素蛋白(H)和融合蛋白(F);一种基质蛋白(M);一种与负链RNA缠绕的核蛋白(N);2种复制酶蛋白,磷酸化蛋白(P)和RNA聚合酶(L)
(图片来源:Griffin,et al.FEMS Microbiol Rev,2012,36(3):649)[4]
麻疹病毒N蛋白有2个功能域(图2-3)[6],一个是N端1-400位氨基酸称为N-CORE,为RNA结合域,是高度保守的,这一区域能抵御蛋白水解,维持核衣壳结构的稳定;另一个是C端第401-525位氨基酸称为N-TAIL,保守性差,含磷酸化位点和抗原决定点,该区域为α-螺旋区,内有Box-1、Box-2、和Box-3三个保守区,相对应的氨基酸序列为第401-420、第489-506和第517-525位氨基酸,其中Box-2(aa 488-506)为分子识别点,通过折叠,诱导P蛋白的黏合。目前已知N蛋白第240-330位氨基酸对维持蛋白稳定性非常重要,第4-188位和中间第303-373位氨基酸参与和P蛋白的结合,这一区域核酸序列高度保守。有研究发现,N蛋白C端的24个氨基酸对MV的转录和复制作用不大,仅仅作为调节区域。麻疹病毒基因组RNA的3′端和5′端17nt顺序具有高度互补性,对非编码区的研究发现,该部位变异的积累可能对病毒编码区的变异也至关重要[7]。
图2-3 N基因结构域图
注:N蛋白由整齐的N端N-CORE(aa1-400)和杂乱的C端N-TAIL(aa 401-525)组成,N-TAIL有三个保守区:Box-1、Box-2和Box-3,其中Box-2是与P蛋白的结合位点
(图片来源:Shu,et al.J Biol Chem,2012,287(15):11951)
核蛋白上已知的3个抗原决定簇,即B细胞表位NP1、NP2和NP3,分别位于第122-150、第457-476和第519-525位氨基酸,其中NP2这一表位相对比较保守。目前,已经确定的CD8+T细胞表位位于第210-218、第226-234和第340-348位氨基酸,而CD4+T细胞表位主要存在于第1-350位氨基酸的部分片段,其中引起免疫反应比较强烈的区域为第321-340和第33-350位氨基酸;N端第67-98和第457-525位氨基酸(68aa)区包含两个辅助性T细胞表位,前者高度保守,而第457-525位氨基酸基因序列高度变异,后者可作为MV分型的依据。这些表位在细胞免疫和体液免疫中起免疫平衡作用。目前很多研究表明N蛋白的细胞表位上存在氨基酸突变,但变异对MV抗原性的影响如何,尚需进一步研究。在疾病的急性期,由于N蛋白为免疫系统提供非常有力的刺激,上述氨基酸突变可能反映了免疫压力。随着病毒氨基酸变化的逐步积累,流行株发生基因漂移时也伴随着抗原性的变化,但当前的一些研究提示,疫苗株和流行株部分基因上的差别并不完全决定所诱发的抗体差异[8]。
(二)P基因及其蛋白
P基因全长1655nt(nt1748-nt3402),编码3种蛋白:P、V、C。P蛋白的编码区长为1524nt(nt1807-nt3330),编码507个氨基酸,分子质量为72kD。P基因相对于其他基因序列较为保守。P蛋白与L蛋白的N-端结合、相互作用形成具有活性的RNA聚合酶,是MV RNA聚合酶复合物中必不可少的组成成分之一,在病毒转录和复制的过程中发挥着重要作用。P蛋白主要负责将N蛋白运输并绑定到新合成的基因组RNA上。P蛋白是一个模块化蛋白,由两个结构域组成(图2-4):一个是变异较大的N-端,PNT(aa 1-230);另一个是高度保守的C端,PCT(aa 231-507)[9]。PNT属于天然的非折叠蛋白,主要负责与N蛋白N-CORE的结合以及复制所需的一些额外功能。PCT包含了转录所需的所有区域,主要有三个特征:①通过一个卷曲螺旋结构低聚化;②在C端存在由三个α螺旋组成的区域,该区域与N蛋白的结合有关;③有一个L蛋白结合位点。在PCT基因范围内有三个AUG密码子,分别位于第371、422和446位氨基酸,但是否有一个密码子用来起始和翻译一个X蛋白尚未知晓。PCT主要负责与N蛋白N-TAIL的结合,通过与N-TAIL的结合来诱导后续的折叠。如图2-4所示,PCT由四个区域组成,从左到右依次是:杂乱无次序的区域(aa 231-303),预测为螺旋的区域(aa 304-376),杂乱无次序的链接区域(aa 377-431),以及一个球状的区域(aa 432-507)。根据多序列比对结果,又可以将C末端的球状区域分为两部分:一部分是aa 432-458;另一部分是aa 459-507,即被称之为XD的区域。XD是由三个螺旋结构组成,主要负责N-TAIL区域的折叠。
图2-4 P基因结构域图
注:该图表明P基因由两部分组成,PNT(aa 1-230)和PCT(aa 231-507).PCT由以下几部分组成:一个杂乱的区域(aa 231-303),一个预测为螺旋结构的区域(aa 304-376),一个杂乱的链接区域(aa 377-431),以及一个球状区域(aa 432-507).最后一个区域又可以分为两部分aa 432-458和aa 459-507(XD)
(图片来源:Johansson,et al.J Biol Chem,2003,278(45):44567)
C蛋白是由P基因的第1829-2389位核苷酸编码,全长561nt,编码186个氨基酸,分子质量为21kD。C蛋白从P基因mRNA第二个翻译起始位点开始合成,即位于P蛋白合成起始位点第22个核苷酸的下游。其功能主要包括:抑制病毒聚合酶的活性、增强感染病毒颗粒的组装效率及通过抑制感染细胞死亡来维持麻疹病毒的长期感染。在不同的麻疹毒株中,C蛋白N端的45个氨基酸为最易发生变异的部分,而其阻止聚合酶活性的能力不会因N端氨基酸变异而变化;其保守区第46-167位氨基酸却恰恰相反。研究还发现,麻疹病毒C蛋白第147-166位氨基酸的自然替换能够调控其活性,但C末端19个氨基酸缺失并不影响其聚合酶调节的活性。
V蛋白是由P基因的第1807-2499位核苷酸和第2499-2705位核苷酸两段序列编码,分别编码231个氨基酸和68个氨基酸。V蛋白与P蛋白有相同的翻译起始位点,但由于在2499位通过RNA编辑插入了一个G碱基而导致了阅读框的改变。因此V蛋白N端的231个氨基酸与P蛋白序列完全一致,C端的68个氨基酸组成独特的结构域,富含半胱氨酸并与锌离子结合,该结构域在副黏病毒里是高度保守的。V蛋白能下调病毒聚合酶的活性,还可以通过与肿瘤抑制因子p73蛋白相互作用,阻止细胞程序性死亡。
C和V蛋白两种非结构蛋白在MV的致病过程中起着重要作用。对C和V蛋白的研究发现,C蛋白可能为病毒体外复制所必须,缺失V蛋白的重组MV也可在培养细胞中有效增殖。通过对不同动物模型如恒河猴、转基因小鼠、棉鼠以及人类胸腺移植SCLD小鼠进行体内C和V蛋白功能分析表明,非结构蛋白对病毒毒力至关重要,C和V蛋白对MV在体内复制和致病起着重要作用。病毒毒力常与病毒破坏宿主干扰素通路的能力相关,C和V蛋白能够调节Ⅰ型干扰素(IFN-α和IFN-β)的产生及其信号通路传导。研究表明MV的C蛋白能够阻止IFN发挥作用,V蛋白能够针对性地阻断IFN-α/β的信号通路,破坏JAK-STAT信号传导,阻止STAT蛋白二聚体形成和核定位作用以及STAT1和STAT2的磷酸化。此外,研究还发现MV的V蛋白也具有阻断IFN-γ信号通路的作用[10]。
(三)M基因及其蛋白
M基因全长为1467nt(nt3406-nt4872),其编码区长为1008nt(nt3438-nt4445),编码335个氨基酸,其编码产物M蛋白分子量为37kDa。M基因5′端的非编码区较长,约为500nt。M基因与F基因之间的非编码区全长约为1003nt,该区的G/C含量高达70%,为MV基因组的特征之一。M蛋白为非糖基化蛋白,与H和F蛋白共同组成病毒的外膜,而M蛋白本身形成病毒外膜的内层,以维持病毒颗粒结构的完整。在MV感染细胞时,M蛋白可能与一个或两个其他糖蛋白的胞浆内结构域发生作用。
(四)F基因及其蛋白
F基因全长为2372nt(nt4876-nt7247),含有两个开放式阅读框,两个阅读框的起始密码子在5′端相隔6个碱基对:一个编码区长为1662nt(nt5449-nt7110),编码553个氨基酸;另外一个为1653nt(nt5458-nt7110),编码550个氨基酸。F蛋白是一种具有膜融合特性的Ⅰ型糖蛋白,核苷酸序列保守,是副黏病毒科成员共有的特征蛋白。F蛋白具有两个重要的功能:一是刺激机体产生中和抗体,诱导的中和抗体对于机体抵抗病毒感染具有重要作用;二是具有融合功能,与H蛋白共同作用,控制病毒与细胞膜融合侵染细胞。此外,F蛋白还控制着病毒的复制和细胞病变效应(cytopathic effect,CPE)的产生、细胞趋向性等生物学功能,是病毒毒力的主要决定因素。麻疹病毒有一种变异株,该变异株的F基因发生突变,导致翻译提前终止,形成的F蛋白比正常的F蛋白分子质量小。
F基因的特点是非编码区长(580nt),GC含量丰富,高达65.1%,该区虽然对病毒的复制、感染并非必需,但却操控着复制的效率和CPE的减少。有专家推测,CPE的减少对于MV在环境中存活是有利的。在病毒增殖时,F蛋白首先被合成为不具活性的前体蛋白F0(60kDa),然后进一步被蛋白酶水解成具有活性的多肽F1(41kDa)和F2(18kDa)。F蛋白的水解位点在第111-115位氨基酸残基上(精氨酸-精氨酸-组氨酸-赖氨酸-精氨酸,R-R-H-K-R),其中第112位精氨酸(R)对蛋白水解、细胞趋向性和膜融合功能具有重要作用。研究发现,F蛋白的第121位、195位、549位氨基酸对膜融合功能起着重要作用。在F1结构单元中,在N端有一个融合肽(aa 113-145),在其C端有一个氨基酸的跨膜区(aa 492-520),在N端和C端分别有一个7个重复序列组成的HR区(Heptad Repeat Domains),包括HR1区(aa 146-182)HR2区(aa 455-490)。在F2中有三个糖基化位点,分别位于第32、第64和第70位氨基酸[11]。
(五)H基因及其蛋白
H基因全长为1958nt(nt7251-nt9208),其中编码区由1854nt(nt7271-nt9124)组成,其编码产物H蛋白由617个氨基酸组成,分子质量为78kDa。H蛋白常以二硫键构成同源二聚体,在细胞膜上以四聚体的形式存在。H蛋白是一种糖基化蛋白,位于MV囊膜表面,能够使猴红细胞发生凝集反应。H蛋白可诱导机体产生中和抗原,在抗MV感染中起着非常重要的作用。H蛋白的主要功能为:①构成病毒粒子表面的纤突,具有神经氨酸酶和血凝素功能;②介导病毒颗粒吸附于靶细胞表面受体,从而启动感染过程;③促进F蛋白的细胞融合;④刺激机体产生中和抗体,参与体液保护性免疫。H蛋白的C端头部负责受体识别活性,膜穿入部分和躯干的大部分特异地促进细胞融合作用。目前,麻疹病毒的主要受体有膜辅蛋白CD46、信号转导淋巴细胞激活因子(signaling lymphocyte activation molecule,SLAM)和黏附分子Nectin-4等。H蛋白与受体结合后会诱导疏水表面附近的氨基酸发生构象改变,进而F和H蛋白的富含Cys区域相结合,导致相连的F蛋白发生构象改变,促使螺旋束结构的形成,释放疏水性融合肽,启动融合过程。
血凝素基因与N基因是MV结构基因中变异最大的,含有多达7%的核苷酸变异。血凝素基因的变异主要影响有3个方面:某些抗原表位的改变会影响中和效价;引起糖基化位点改变;导致H蛋白分子质量的改变。近年来大量研究表明,血凝素蛋白的变异率大,且变异的位点多为糖基化位点,呈现突变速率加快的态势。
H蛋白有4-6个潜在的N-糖苷键连接的糖基化位点(aa 168-170、aa 187-189、aa 200-202、aa 215-217、aa 238-240、aa 416-419),均分布在胞外区,部分被糖基化酶所利用,糖基化位点对MV H蛋白的抗原性和折叠是必需的。血凝素蛋白有13个高度保守的半胱氨酸(cys)区,大部分形成分子内二硫键,靠近穿膜区的半胱氨酸可形成分子间二硫键。血凝素蛋白是Ⅱ型跨膜糖蛋白,增加一个糖基化位点可能使蛋白稳定性增高而活性降低。血凝素蛋白的第253-256位氨基酸(RVFE)是保守的序列,起维持三级结构作用。目前已经证实,H蛋白的第35-58位氨基酸为跨膜区,用单抗鉴别出两个顺序性B细胞表位BCE(第236-256位氨基酸为中和性表位;第386-400位氨基酸为血凝素样表位)。在对初步减毒的Edmonston B株的研究中发现,血凝素蛋白的第368-396位氨基酸是MV的神经毒力功能区。近年研究又发现,血凝素蛋白的第195和200位氨基酸也是神经毒力功能区,血凝素蛋白神经毒力区域变异和抗体逃逸二者在位点上似乎不存在相关性[8]。近几年膜表面糖蛋白的深入研究对阐明病毒蛋白的结构与功能、病毒与细胞的相互作用、感染的发生机制,以及对新型疫苗的研制具有重要意义。
(六)L基因及其蛋白
L基因是MV结构基因中最长的一个,全长为6643nt(nt9212-nt15854),编码区长为6552nt(nt9234-nt15785),编码2183个氨基酸,其编码产物L蛋白分子质量为210kDa。L蛋白具有RNA聚合酶的活性,在病毒的复制和转录过程中发挥着重要的作用。RNA聚合酶缺少校正功能,因此,在MV复制和转录过程中,环境的影响可能引起基因组的突变。L蛋白上有多个功能催化基团,除了RNA聚合酶的活性外,L蛋白还有mRNA甲基转移酶活性,可以催化聚腺苷酞化,聚腺苷酞化活性功能区定位于C端保守功能区。由于在病毒复制和转录中的重要作用,L蛋白的进化存在约束,所以氨基酸序列相对保守。