1.3 转录组亲缘学及其他
全基因组测序花费高,对于重复序列占比大、杂合度高和非二倍体基因组,序列正确拼接组装十分困难(陈等,2010)。显然大规模比较转录组研究更具可行性。转录组测序(RNA-Seq)数据基于表达的mRNA,不包括内含子信息,没有重复序列和倍性的干扰。初始的转录组亲缘学概念指多物种的基因共表达分析(Kohonen等,2007),物种间进化距离分析可基于转录组信息。显然转录组亲缘学也可应用于药用植物研究,例如,从19种植物(包括虎杖、红豆杉、银杏和人参等药用植物)转录组数据中提取50个单拷贝直系同源基因(郝等,2012),可用于系统树构建和进化分析。从紫菜属(P. umbilicalis)和P. purpurea的454焦磷酸测序获得482个编码红藻植物门头发菜纲紫菜属(Porphyra)膜转运蛋白的EST序列(Chan等,2012),发现存在内共生和与原生藻菌有关的水平基因转移。此研究提供了海洋藻类钠偶联的转运系统的分子特征和共调控机制。重建陆生植物和藻类的起源和进化过程是植物系统发育的基本课题,对理解关键适应性性状的产生十分重要。由于物种快速多样化导致一些进化关系分辨不清,少数几个分子标志明显不够,基因组尺度的数据显著增加了有信息位点数量。中药资源和中药鉴定是应用性很强的领域,尽管考虑的是中药材,但应避免一叶障目不见泰山的尴尬,全面挖掘中药资源和物种的准确界定都离不开其所在族属完全物种取样的分子系统学研究(黄等,2014)。转录组代表能表达的那部分在功能上活跃的基因组,测序费用的大幅降低和生信分析方法的改进使得密集物种取样的转录组亲缘学研究成为可能。例如,从92种streptophyte绿藻转录组数据和11种陆生植物基因组序列中提取共有的直系同源基因(Wickett等,2014),用其中852个核基因(1701170个序列联配位点)构建系统进化树,发现陆生植物和绿藻Zygnematophyceae为姊妹关系(图1-5),地钱(liverwort)和地衣(moss)组成的分支与维管植物分支为姊妹关系,而角苔(hornwort)与所有非角苔陆生植物为姊妹关系,从而证伪了之前关于早期陆生植物进化的假说。转录组亲缘学加深对基本植物性状进化的认识,包括药用植物化学多样性和相关生合路径的进化。
图1-5 获支持证据最多的陆生植物系统发育假说
尽管只被应用了极短的时间尺度,人工选择已经极大地改变了驯化植物的形态、生理、植化和生活史。比较RNA-Seq数据可用于解析种植番茄和五个近缘野生物种间基因序列和基因表达差异(Koenig等,2013)。基于序列差异发现>50个基因经受正选择,数千个基因的表达水平有显著差异,许多是由于选择压力所导致。许多快速进化基因与环境应答和应激耐受有关。野生和种植品系间光反应共表达网络的大规模变化进一步强调了环境输入量对于基因表达进化的重要性。人工定向杂交和间接有利于非同义替换的驯化和改良过程已经极大地改变了番茄转录组。比较转录组有助于深入了解人工选择和自然选择对野生和种植品系的普遍效应,基于转录组的亲缘树构建有助于定量研究各近缘物种的起源时间和进化历程,这对药用物种研究的重要性是不言而喻的。
类似地,基于蛋白质组数据进行系统发育分析,有蛋白质组亲缘学(phyloproteomics)(Villar等,2013),但尚未用于植物研究。表观基因组亲缘学(phyloepigenomics)(Martin等,2011)在表观遗传修饰层面考察物种亲缘关系,用于药用植物研究将有新颖发现。宏基因组亲缘学(phylometagenomics)(Brindefalk等,2011)可用于研究药用植物根际微生物和植物内生菌等。例如,对中国西南地区7种石斛植物的内生真菌进行抗菌活性筛选,考察活性菌株之间的遗传关系(崔等,2012)。采用组织块法分离真菌,琼脂扩散法进行抑菌活性筛选,通过rDNA的ITS序列鉴定真菌,用邻接法(NJ)和最大简约法(MP)考察遗传关系。从7种石斛属植物分离到98株真菌,它们对Escherichia coli、Bacillus subtilis、Staphylococcus aureus、Candida albicans、Cryptococcus neoformans和Aspergillus fumigatus的抑制率分别是1.02%、10.2%、18.4%、1.02%、1.02%、10.2%,其中DL-3、DL-18、DL-21、DM-2、DG-10和DN-1对B. subtilis、S. aureus和A. fumigatus有较强的生长抑制。24株活性真菌隶属于7个目、11个属、14个种,NJ和MP系统树阐明活性菌之间的亲缘关系。本研究有助于考察珍稀濒危石斛属植物的内生真菌的生物活性以及它们之间的遗传关系和生态价值,为石斛根茎部活性真菌的研究提供参考。比较分析来自南京和大连红豆杉根际的15个16S rRNA和15个ITS MiSeq测序文库(Hao等,2016),并从根际分离高产漆酶真菌和多环芳烃(PAH)高效降解真菌菌株,研究红豆杉根际微生物群落的物种变异性和潜在的环境/化工制药应用。高通测序得到的读序分属31个细菌门的2141个操作分类单位(OTUs),以及至少7个真菌门的2904个OTUs。构建所有细菌/真菌OTUs的16S rRNA/ITS亲缘树,明确各根际样品微生物群落的亲缘关系(图1-6)。矮紫杉和曼迪亚红豆杉根际浮霉菌(Planctomycetes)、放线菌(Actinobacteria)和绿弯菌(Chloroflexi)丰度高于南方红豆杉根际(NF),而酸杆菌(Acidobacteria)、变形杆菌(Proteobacteria)、硝化螺菌(Nitrospirae)和未分类菌在后者丰度更高(图1-7)。NF富含子囊菌门(Ascomycota)和接合菌门(Zygomycota),而两种温带红豆杉根际富含未分类真菌担子菌门(Basidiomycota)和壶菌门(Chytridiomycota)。NF的细菌/真菌群落富裕度和多样性低于其他种红豆杉根际。红豆杉根际分离的3株高产漆酶真菌可以高效脱色3类活性染料,而2株PAH降解真菌能转化难降解的致癌物苯并芘。该研究拓展了根际微生物多样性的知识谱系,例证了资源植物根际研发的范式转变。
图1-6 来自不同红豆杉根际微生物群落对比
基于β-多样性距离矩阵的层次聚类分析显示不同红豆杉根际微生物群体间的关系。用Qiime和Bray-Curtis算法计算β-多样性距离矩阵;用UPGMA(非加权配对算术平均法)算法建树。枝长代表样品间距离。(a)细菌(XJ),(b)真菌(Z);ZS,矮紫杉,MD,曼迪亚红豆杉,NF,南方红豆杉
图1-7 红豆杉根际不同微生物纲的相对组成丰度
图1-7(a)~(c),细菌。鞘脂杆菌纲(Sphingobacteria)、纤维黏网菌(Cytophagia)和黄杆菌纲(Flavobacteria)属于拟杆菌门(Bacteroidetes);Phycisphaerae属于浮霉菌门(Planctomycetes);厌氧绳菌纲(Anaerolineae)属于绿弯菌门(Chloroflexi);Spartobacteria属于疣微菌门(Verrucomicrobia)。(d)~(f),真菌。座囊菌纲(Dothideomycetes)、散囊菌纲(Eurotiomycetes)、锤舌菌纲(Leotiomycetes)和粪壳菌纲(Sordariomycetes)属于子囊菌门(Ascomycota);银耳纲(Tremellomycetes)、微球黑粉菌纲(Microbotryomycetes)和伞菌纲(Agaricomycetes)属于担子菌门(Basidiomycota)。
系统发育基因组学对计算能力和分析方法提出了新的挑战,故有计算基因组系统学。