药用植物亲缘学导论
上QQ阅读APP看书,第一时间看更新

1.6 药用植物亲缘学与药用基因组亲缘学

直系同源基因是在物种形成过程中由共同祖先基因演变来的分布于不同物种的基因,在药物发现过程中有助于动物模型的选择和分析流程的建立。葛兰素公司的Searls首次使用pharmacophylogenomics一词,认为充分利用基因组数据挖掘直系同源基因,能更好地预测药靶基因功能。比较实验动物和人的基因组,不仅可找到保守功能元件,包括蛋白编码基因和非编码序列,而且能发现基因功能的迁移,从而使研究者充分认识物种间遗传差异,避免选用不适当的动物模型和药物筛选方案(郝等,2014)。

Searls提出的pharmacophylogenomics是针对药靶的研究,而笔者提出药用基因组亲缘学,是在基因组及其相关的转录组和代谢组水平系统研究药用植物的植物亲缘关系-化学成分-疗效(传统疗效及药理活性)间的相关性的新兴边缘学科。药用基因组亲缘学在药用植物领域可以有多方面的应用:① 基于基因组信息构建不同尺度的生命之树,明确药用植物类群间的系统发育和亲缘关系;② 利用基因组数据估算分化时间并重建地理分布区,推测现存药用植物/道地药材的起源和空间分布格局及其形成机制;③ 基于时间树,结合生态、环境因素及代谢创新性状,探讨药用植物的多样化进程和成因;④ 揭示药用植物多样性的来源和格局,基于生物多样性探讨药用化合物(如次级代谢产物)多样性,促进生合途径解析和创新药物发现;⑤ 预测药用植物多样性动态变化,提出相应的保护性开发策略,促进人工栽培和分子育种。可见针对药用植物的基因组亲缘研究的内容完全不同于Searls原初的概念,只是暂借用pharmacophylogenomics作为药用基因组亲缘学英译。

笔者拟整合形态分类数据、代谢组和化学分类数据、基因组和转录组数据、药理活性数据和传统药物学知识,探索以毛茛科药用植物科属为重点的药用植物亲缘学。毛茛科药用植物在中药学中的应用源远流长,我国42属约720种毛茛科植物中,有30属约220种可供作药用(《中国植物志》27卷24页)。黄连、附子、乌头、升麻、川木通等的原植物均属毛茛科。民间广泛使用的麻布七、水黄连、铁破锣、虎掌草、月下参、驴蹄草、星果草、白头翁等草药也属于毛茛科。据笔者统计,在《中国药典》2010年版正文收录10个法定种,附录收录另10种,另外在可见的地方标准中至少收录了另外的20种,共计40种,高于菊科、豆科等大科的收录数量,居所有植物科中的第一位。毛茛科大部分族属在我国均有悠久的药用历史,其防治疾病的科学价值经历了时间的考验。但目前对毛茛科的组学研究,尤其是基因组和转录组研究十分稀缺,对毛茛亚科多物种属的近缘种间亲缘关系了解较为粗浅,对唐松草亚科的一些多物种属,如唐松草属(朱和肖,1991a;郝等,2015b)、人字果属(肖和王,1964;朱和肖,1991b),了解更少。这一现状也为进行药用基因组亲缘学的实证研究提供了很多课题。

人字果属约16种,分布于亚洲东部和喜马拉雅山区。我国9种,分布于秦岭以南的亚热带地区,均由肖培根和王文采在20世纪60年代正式命名(1979《中国植物志》27卷472页)。据不完全调查,本属至少7种在分布地区的民间用作草药,具有确切的功效(陈等,2001)。例如,耳状人字果全草止咳化痰、消炎,蕨叶人字果根状茎消肿解毒,纵肋人字果全草健脾化湿、清热明目,人字果根状茎清热解毒、消肿。但是此属在毛茛科中是研究较少的,其药用价值值得深入挖掘。基于4个分子标记和形态特征得到的系统树提示,人字果属与扁果草属和拟扁果草属聚为一支,而与耧斗菜属、天葵属和拟耧斗菜属进化距离较远(Hao等,2015b)。从预实验结果看,人字果属的化学成分独具特色(参见第4章)。拟选择耳状人字果、蕨叶人字果、纵肋人字果和人字果4种,进行酶切位点相关DNA测序(RAD-Seq)。只有分别带有接头1和接头2的酶切位点周边的DNA片段会得到有意义的扩增,即为RAD标签(图1-9)(岳等,2012)。将所有RAD标签序列连起来即代表物种的简化基因组,可用于同属物种或同种各居群的基因组亲缘关系推断(图1-10)。在进化史近期发生快速辐射分化的同属物种,往往由于有限几个分子标记的系统发育信号不足和/或基因树冲突,使得其亲缘关系难以辨清。人字果属和铁线莲属以及毛茛目其他多属均有此问题。以RAD-Seq为代表的简化基因组测序能提供关于物种基因组进化和杂交的全局观点,且无需事先知晓物种基因组的完整序列。基于此探索的科学问题:四种人字果的基因组亲缘关系是什么?粉背叶人字果(进行转录组测序)与这4种人字果的亲缘关系?化学分类与分子分类是否一致?如何从起源和进化角度解释?本属与唐松草亚科其他属的药用亲缘关系?

图1-9  RAD-Seq技术路线

size selection:选择适宜长度的DNA片段

图1-10  RAD-Seq技术应用

PE—双末端;InDel—碱基插入/缺失;SV—剪接变异体;PCA—主成分分析;QTL—数量性状基因座位

在药用植物亲缘学框架下进行中药资源研究的一个代表性例证是关于乌头属的亲缘学研究(肖等,2006;Hao等,2013a)。毛茛科乌头属全世界约有300余种,其中超过半数分布在中国。发现牛扁亚属是以牛扁碱和C18-二萜生物碱为主的类群,由于其毒性中等,因而可从中寻找镇痛、抗炎等新药前体。乌头亚属下唐古特乌头系和圆叶乌头系是以内酯型二萜生物碱为主的类群,毒性较小,是新药寻找的重点研究类群。褐紫乌头系则以C20-二萜生物碱如光翠雀碱和宋果灵为主,杂有高度进化的乌头碱型二萜生物碱如乌头碱等成分。化学分类上不支持其独立成为一个分支。显柱乌头系是以含大茴香酸酯基的乌头碱型二萜生物碱以及塔拉萨敏和查斯曼宁胺醇类为主的类群,是块根较大的“大乌头”的主要来源,具大毒。乌头系以含15-羟基的单酯、双酯或多酯以及胺醇类乌头碱型二萜生物碱为主,且酯基中无大茴香酸酯基,此系是草乌的主要植物来源,具大毒。显柱乌头系、乌头系、兴安乌头系和蔓乌头系可能代表乌头亚属进化的类群。从二萜生物碱化学成分来看,露蕊乌头亚属与乌头属另外两亚属差别很大,结合分子系统发育研究、形态学和细胞学结果,支持其为一单独属,介于翠雀属和乌头属之间(Wang等,2013)。基于细胞核和叶绿体DNA序列的分子系统树将形态极相近的九系分为两群(Hao等,2015a),一为甘青乌头系、圆叶乌头系、保山乌头系和短柄乌头系,均非单系群而是彼此交织;另一为乌头系、兴安乌头系、显柱乌头系、蔓乌头系和准噶尔乌头系(图1-11),亦均非单系群,化学分类数据支持此分群。为了乌头资源的可持续利用和发现高效低毒的新化合物,有必要将近年涌现的高通量技术用于乌头研究。基因组学和转录组学技术(参见第3章)将在促进乌头生物活性化合物研究中发挥关键作用。

图1-11  毛茛科翠雀族亲缘关系

根据Hao等,2013;Wang等,2013。露蕊乌头Gymnaconitum Staphisagria曾分别被处理为乌头属(Aconitum)和翠雀属(Delphinium)亚属。飞燕草(Consolida)曾被认定为独立一属,可能属于翠雀属

毛茛科是一个比较原始的真双子叶植物类群,已知代表性药用化合物包括苄基异喹啉生物碱、毛茛苷、三萜皂苷和二萜生物碱等。笔者结合近年植物化学研究进展,对毛茛科所含主要化学成分类型和分布进行了系统归纳总结(参见第5章)。毛茛苷和木兰花碱在一些属(如毛茛属、铁线莲属和驴蹄草属等)共存,而非交替出现(Xiao,1980)。结合了疗效数据(肖等,1986)的药用亲缘分析(彭等,2006a,2006b),支持基于分子标记和形态数据提出的分类系统。毛茛科可分为五个亚科:毛茛亚科,唐松草亚科,黄连亚科,黄毛茛亚科和白根葵亚科。毛茛亚科可分为十族。铁线莲属与白头翁属和银莲花属(图1-12)均属于银莲花族,均含较多五环三萜皂苷;铁线莲属还含有黄酮、花青素、木质素、香豆素和生物碱等(孙等,2009;Hao等,2013b),其中五环三萜皂苷已用于化学分类研究。升麻族中,类叶升麻属和升麻属的疗效和化学成分相近,因此两属的亲缘关系也近(高等,2008;Hao等,2013c)。由于它们果实的形态差异,以及细胞学特征不同,考虑这两属为升麻族植物的一个分支,且类叶升麻属较升麻属更为进化。从化学分类学的角度来看,铁破锣属含有特殊铁破锣皂苷,可以成为一个独立的分支。基于细胞核ITS序列的系统发育树支持以上分析(Hao等,2015a)。黄三七属既和铁破锣属一样含有五环三萜和铁破锣型环阿尔廷烷四环三萜类,又和升麻属、类叶升麻属一样含有吲哚生物碱,因此认为它是铁破锣属和升麻属、类叶升麻属之间的过渡类型。可从毛茛亚科各族选择10个代表种(猫爪草,小木通,美花草,星果草,驴蹄草,升麻,铁筷子,黑种草,北乌头和金莲花),进行高通量转录组测序,从组装的Unigene中找到单拷贝直系同源基因(>400),联用这些基因序列构建系统进化树,结合化学和形态分类、药理活性和传统药物学资料,考察转录组数据在药用亲缘关系推断中的可用性。

图1-12  草玉梅(Anemone rivularis,香格里拉高山植物园)

虎耳草目芍药科(Paeoniaceae)是单属科,由毛茛科芍药属(Paeonia)独立而来。芍药属约35种,分为3个组,即牡丹组(Sect. Moutan)、北美芍药组和芍药组(Sect.Paeonia),中国是芍药科植物的起源、演化、分化发展及多样性中心,特别是牡丹组为我国特有植物。深入探讨芍药属药用亲缘关系,阐明该属植物的分类学地位和种间关系,可为资源利用和保护提供依据(何,2010;何等2010)。基于对牡丹种子的化学成分研究,系统分析中国产芍药属种子的化学成分含量与分布,统计分析揭示其化学分类学意义;快速色谱分析白芍、赤芍和牡丹皮的指纹特征,用化学计量学方法分析三味药材化学成分的差异,探讨三味药材药性的差异与化学成分差异之间的相关性;基于芍药属牡丹组和国产芍药组的指纹图谱,进行化学分类学探讨,揭示芍药属根部主要次生代谢产物分布特点。探讨芍药属(科)的药用植物亲缘学关系,根据药用植物亲缘学理论展望牡丹种子资源利用前景。对牡丹(P. suffruticosa)成熟种子的乙醇提取物进行分离,通过多种波谱学技术鉴定其中31个化学成分,其中芪类成分11个,单萜苷类11个,黄酮类4个,其他类5个。10种芪类化合物具有清除DPPH自由基和诱导Keap1-Nrf2-ARE信号通路的适度活性,可能有抗癌、抗衰老、抗炎的应用潜力。用HPLC-DAD技术分别建立了同时测定10种芪类和8种苷类化合物的含量测定方法,对芍药属种子46份样品(牡丹组32份,6种4变种1杂种;芍药组14份,3种)进行含量测定,用主成分分析(PCA)探讨芍药属化学分类学。对传统药用部位根/根皮进行指纹图谱研究(He等,2010,2014)。用HPLC整体柱快速分析比较白芍、赤芍和牡丹皮81份样品的指纹图谱,建立图谱共有模式,PCA能很好地区分三味药材。用HPLC-DAD方法对国产芍药属52份样品(牡丹组8种29份,芍药组6种23份)根部的主要次生代谢产物进行全面分析,分别建立牡丹组和芍药组的图谱共有模式,用PCA分别比较两组植物,均显示不同程度的区分。化学分类结果与基于形态和地理分布的经典分类较为一致,只有四川牡丹(P. decomposita)例外,其为牡丹和野牡丹两亚组间的过渡种。根据相同的代谢指纹图谱,凤丹(P. ostii)和牡丹(P. suffruticosa)是同一物种。野牡丹(P. delavayi)代谢轮廓变异大,但与黄牡丹P. ludlowiiP. lutea)无显著差异,提示两物种亲缘关系较近(图1-13)。上述结果结合今后的基因组亲缘分析,对芍药属和相关类群的化学分类和药用亲缘研究具有指导意义。

图1-13  用最大似然法(ML)构建芍药属ITS系统发育树

基于GTR模型推测进化史。图示为对数似然值(–4604.6165)最高的系统发育树。用Maximum Composite Likelihood 方法估算配对距离矩阵,基于此用邻位连接和BioNJ算法获得初始树用于启发式搜索,然后选择对数似然值高的树形。用离散γ分布建模位点间进化速率差异(5种进化速率;+G,0.4984)。速率变异模型允许一些位点在进化过程中不变(+I,5.40%位点)。树按比例绘制,单位支长代表每位点碱基替换数量。本分析包括64个核苷酸序列,数据集有887个序列联配位置,用MEGA6软件建树。物种名前为NCBI GenBank登录号

近年药用亲缘研究还涉及小檗科(彭等,2006c),百合科贝母属(Hao等,2013d)、冬青科冬青属(Hao等,2013e)、五味子科(刘,2009;许等,2008)和唇形科鼠尾草属(Li等,2008,2013)等。基于薯蓣科薯蓣属(Dioscorea)植物形态分类学和分子分类学,通过分析薯蓣属植物传统药效和植物化学成分,对薯蓣属药用植物亲缘关系进行综合研究(黄等,2015)。中国薯蓣属植物约17种,富含甾体皂苷,均属根状茎组(Sect.Stenophora Uline),其他植物均为块茎,富含多糖、鞣质等化学成分,表现出不同的药效作用。根据薯蓣属植物已知的化学成分和药效作用,结合经典形态分类学,将薯蓣属植物归为甾体皂苷组、多糖组、多酚组、黄独素组、薯蓣碱组和其他组。以5个苯乙醇苷类化合物为对照品,采用HPLC-UV测定,探讨苯乙醇苷类在苦苣苔科药用植物中的分布规律及其在系统发育上的重要作用(白等,2013)。苯乙醇苷类广泛分布在苦苣苔科植物中,不同种类的苯乙醇苷类成分在不同植物类群中分布有明显差异:阿克苷在本科植物分布广泛;paraboside B、isonuomioside A、paraboside Ⅱ、paraboside Ⅲ在自然界较少见,在本类群呈间断分布。结果从化学成分方面佐证了形态学支持的苣苔科芒毛苣苔族比长蒴苣苔族进化的观点。这些研究均需要在组学层面继续深化。