卷柏

注册

 

发新话题 回复该主题

早期维管植物卷柏属Selaginell [复制链接]

1#
北京哪家医院治疗白癜风效果最好         https://wapjbk.39.net/yiyuanzaixian/bjzkbdfyy/

Shim,H.,Lee,H.J.,Lee,J.,Lee,H.O.,Kim,N.S..().Plastidgenomesoftheearlyvascularplantgenusselaginellahaveunusualdirectrepeatstructuresanddrasticallyreducedgenenumbers.InternationalJournalofMolecularSciences,22(2),.

摘要

卷柏属(Selaginella)是卷柏科(Selaginellaceae)的唯一属,其早期维管植物与蕨类植物一样,在进化史上占有重要地位,是解读植物进化的宝贵资源。本研究:(1)测序并组装了卷柏、旱生卷柏、兖州卷柏的质体基因组(质体)序列。与植物质体中常见的反向重复(IR)结构不同,卷柏属(Selaginella)物种具有直接重复(DR)结构,OxfordNanoporelong-read序列组装证实了这一点;(2)对包括2个石杉属和1个水韭属在内的19个石松类植物的比较分析,揭示了在卷柏属物种和相关的石松类物种之间独特的系统发育关系,反映在两次大的结构重排导致了质体序列中IR和DR块之间的动态变化;(3)揭示了卷柏属物种其他不常见的特征,包括基因组长度较短,基因和内含子数量急剧减少,GC含量高,以及广泛的RNA编辑位点。

引言

叶绿体是最典型的质体形式,是光合作用植物和藻类中发现的半自主细胞器,含有它们自己的基因组。质体基因组(质体)通常长-kb,四分体结构由一个长的单拷贝(LSC)区和一个短的单拷贝(SSC)区组成,中间隔着两个反向重复序列(IRA和IRB)。质体大约包含个基因,其中大多数编码蛋白在光合作用、蛋白质合成和DNA复制方面起作用。虽然基因序列和基因组结构在不同的类群中得到了广泛的保存,但在植物进化过程中,质体基因组经历了显著的基因组缩减和重排。

蕨类植物谱系的质体基因组变化差异非常明显,存在大量倒位和基因丢失的现象。比如与苔藓相比,蕨类植物质体基因组有5个倒位。如松叶蕨属chlB,chlL和chlN基因的丢失。蕨类植物是由石松类和真蕨类两大类组成,在维管植物系统发育中,它们形成了不同的进化谱系。石松类是一个古老的世系,在陆地植物进化获得维管组织后不久就出现了分化,主要包括3个科:石松科、水韭科和卷柏科。卷柏科只有一个属,卷柏属,但是其含有多个物种,分布在不同的生境,包括沙漠、热带雨林、高山和北极地区。

石松科在漫长的进化历史中保留了祖先状态基因顺序,表现出一种高度停滞的状态。水韭科质体基因组同样展现出高度保守的结构,但是和石松相比水韭组发生了三个重排事件:IRa向LSC扩张,将rps7基因包括在内;ycf2基因从LSC发生移位至SSC;chlL和chlN基因发生倒位并和ycf2相邻。)石松科、水韭科质体基因组高度保守,但是卷柏科却发生了大量丢失IR区收缩、扩张以及结构重排事件。其中最显著的就是IR区域的方向有反向变为同向,以及GC含量高和RNA编辑的高度出现。平均GC含量为37.38±2.26%。然而,5种卷柏质体的GC含量平均为52.8%。在开花植物的质体中检测到大约-个C-to-URNA编辑位点,而在S.uncinata质体中发现了多个C-to-URNA编辑事件。RNA编辑(RNAediting)是转录后或与同时进行的对基因组编码的RNA序列进行修饰的过序列进行修饰的过程,主要包括C-to-U、U-to-C、A-to-I以及U的插入或缺失、多个G或C的插入等多种编辑类型。RNA编辑是基因转录后在mRNA中插入、缺失或核苷酸的替换而改变中插入、缺失或核苷酸的替换而改变DNA模板来源的遗传信息,翻译出多种氨基酸序列不同蛋白质。

在本研究中,通过叶绿体全基因组测序对卷柏属三个种-卷柏(SelaginellaTamariscina)、旱生卷柏(SelaginellaStauntoniana)和兖州卷柏(SelaginellaExinvens)的质体进行了测序,并使用Illumina测序平台和牛津纳米孔长载体平台,组装了它们的完整质体。全文通过对基因组特征进行了全属范围的比较,包括GC含量、基因组结构变化和基因丢失。这一分析揭示了石松科卷柏属植物质体的显著动态特征。

材料与方法

1.取样

在韩国全罗南道和济州岛分别采取卷柏物种样品,并从Genebank下载了13个卷柏属物种和3个非卷柏属物种的序列。

2.DNA提取、测序、质体组装和注释

3.PCR扩增对直接重复结构的确认

为了确定旱生卷柏的直接重复结构,根据重复区域与两个单拷贝(LSC和SSC)的连接位置设计了引物。用不同的引物组合扩增质粒连接位点。假设的直接重复区由引物组合1/2、3/4、5/2和3/6扩增,而假设的反向重复区由IRb的1/3和2/4的不同引物组合扩增

4.基因含量与系统发育分析

提取19个物种的CDS、rRNA和tRNA,标记存在基因和假基因,使MAFFT对其进行比对。将用BEAST软件对其进行分化时间估计。

5.内含子变异与RNA编辑位点分析

(1)从细胞中提取RNA,并对其进行建库测序拼接组装。

(2)对所有19个物种的质体中的基因进行了调查,以检查内含子区域的存在。对10种石松类质体的CDS起始密码子和终止密码子中潜在的C-to-URNA编辑位点进行了研究。以ACG序列代替ATG序列的起始密码子和以CAA、CAG和CGA序列代替TAA、TAG和TGA序列的终止密码子被认为是潜在的RNA编辑位点。对所有10个物种的潜在RNA编辑位点进行了标记和分析。

(3)为了确定潜在的RNA编辑位点是否已经经历了编辑过程,将来自旱生卷柏的原始RNA测序数据重新映现到参考基因组上。获得CDS的起始密码子位置和终止密码子位置,并使用CLCfindvariationssoftware(ver.4.3.0)用于检查C核苷酸的未编辑mRNA读数和T核苷酸的编辑mRNA读数的分布(以前在RNA测序过程中变为T的RNA中的U)。

结果

1.卷柏属的LSC长度减少和具有特殊的DR结构

卷柏属植物的质体大小在,~,bp之间,平均为,±11,bp;非卷柏属植物的质体大小在,~,bp之间。总体而言,卷柏属物种的LSC区域减少,一些物种的LSC区域大小几乎是非卷柏植物的一半。除3种卷柏(卷柏、海南卷柏和落叶卷柏)外,大多数卷柏的SSCs比LSCs长。

卷柏属(Selaginella)多数种共有一种独特的质体结构,该结构由一组正向重复序列(DR)组成,而不是大多数质体中发现的反向重复序列(IR)。下图是根据假想的DR和IR结构的连接位点设计的引物组合通过PCR扩增证实了该DR结构,可以看出在凝胶电泳中只有同向互补序列显示被扩增。

2.卷柏比其他石松属植物含有更少的基因

由BEAST系统树可以看出,将19个石松类物种的系统发育分析分为三大类群,包括一个非卷柏属种的类群和卷柏属内的两个谱系,在卷柏属的第一个亚组,只有S.lepidophylla包含反向重复区IR,其他均为DR。第二个亚组,只有S.hainanensisandS.uncinata包含IR。右图表示每个物种对应的基因含量。蓝色方框表示存在基因,灰色方框表示假基因,白色方框表示缺失的基因。可以看出非卷柏属物种非常保守,几乎不存在假基因和缺失的基因,而卷柏属则存在大量的编码基因丢失和假基因化现象。在图中可以看到,最突出的就是tRNA的丢失。此外,卷柏属物种ndh基因丢失现象也很严重,双沟卷柏质体基因组中的所有ndh基因均由于移码突变内部出现终止密子变成了假基因。

3.系统发育分析显示了两个具有动态构造变化的主要谱系

第一组为非卷柏属植物,质体具有典型的质体结构,含有IRS。卷柏属(Selaginella)物种通过从LSC中的TrnF-GAA到IRBs和SSC交界处的trnN-GUU的位置发生了倒位,这个倒位使部分LSC区域到了在SSC区域,导致卷柏属物种的LSC缩短和SSC扩张。因为参与这一倒位事件的区块包含一个重复区,也就是IRB,使它最终与未受影响的重复区IRA方向相同,从而在卷柏属物种中形成了同向互补DR的独特结构。第二个倒位事件独立地发生在两个谱系中(图3中的红色菱形)。因为发生倒位的区域包含DRb,所以DRb再一次被转换,这一次倒位事件是DRb重新变回IRb。

4.5个不同卷柏质体的差异性性反映了地理的差异性性

5种不同的卷柏存在单核苷酸多态性(SNPs)和插入/缺失(INDELs)的数量较多,说明不同地区卷柏物种内的差异较大,种内多样性较高。

5.卷柏属存在基因丢失和高GC含量的特点

该图显示了在19种植物的质体中鉴定出19个含有内含子的基因(13个蛋白质编码基因和6个tRNA基因)。-不含内含子灰色:基因丢失或假基因化。石松属和水韭属保留了大部分这些基因中的内含子。但是,从该表中看出卷柏属rps12、ycf66和rps16基因丢失,tRNA的大部分基因丢失或内含子缺失,这些都是使卷柏质体中的内含子数量大大减少的原因。

6.卷柏属物种具有广泛的RNA编辑位点

19种石松类的起始密码子(A)和终止密码子(B)中潜在的C-to-URNA编辑位点。蓝色条(‘异常’)代表起始密码子ACG和终止密码子CAA、CAG或CGA的基因百分比,它们是潜在的RNA编辑位点。橙色条(‘正常’)表示起始密码子ATG和终止密码子TAA、TAG和TGA正常的基因的百分比。灰色条(‘其他’)表示带有起始密码子或终止密码子的基因不属于这两种类型的百分比。卷柏属植物的异常起始密码子比率较高(23%-79%),石松属只有不到10%;大部分卷柏属物种的异常终止密码子比率也高于石松属

讨论

1.卷柏属质体的独特特征

卷柏属质体的平均大小为,±11,bp,虽保留了典型的四分体质体基因组结构,但大多数卷柏属植物在SSC扩张和LSC收缩的情况下发生了方向性变化

2.卷柏属物种进化过程中一个普遍和两个独立倒位导致DR和IR结构的出现

Selaginellavardei等质体基因组为DR结构的类群中存在一个约50kb的倒位片段。该倒位片段跨过整个IRb区域,从而将重复区由IR转变为了DR,由Beast看出,对比石松属,估计该事件发生约为的64.24万年。DRBs再次发生倒位,恢复了IRBs并延长了LSCs,该事件发生约25.64万。下面这个DRb倒位发生的时间约在4.51-1.03万年,由于之前只用了rbcL这一单独基因,所以会出现时间比该实验早。

DR结构之前只在红藻的质体基因组中被报道过。卷柏科和红藻独立起源,由于石松类内部石松科和水韭科的质体基因组均为IR结构,推测石松类祖先质体基因组的结构应该也是IR结构的。因此,DR结构是在卷柏科与水韭科分化之后在科内发生的。祖先状态重建的结构也表明DR结构是卷柏科质体基因组的祖先状态。DR结构是在石松科和水韭植物向卷柏进化的过程中,由于trnF-trnN这一长达50kb的片段发生倒位而导致。3.基因内含子丢失

动态结构重排事件的发生,卷柏属物种显示出严重的基因丢失的证据,这导致了它们的整体小质体体。最明显的损失涉及NDH基因,NDH基因的丢失可以被核编码的NDH基因补偿[45],该基因编码NADH脱氢酶,在光合作用过程中起电子传递的作用。但在塔玛拉索裸子植物中不存在核NDH基因。核基因组中的同源基因可能已经取代了卷柏属物种质体中缺失的一些基因的功能,其他基因也可能是如此。由于卷柏(Selaginella)质体中tRNA的数量严重不足,缺乏明确的证据证明质体中存在核源tRNA物种。卷柏质体中含有内含子的基因的缺失似乎是导致内含子数量减少的原因。

4.高GC含量和广泛的RNA编辑位点

与核基因组不同,细胞器基因组是AT偏向的。卷柏质体中50%的GC含量高于其他真核细胞器基因组,AT突变压力或AT偏向基因转换(或两者兼而有之)被认为是导致大多数质体变得偏向AT的原因。但是,提出无偏突变/基因转换使卷柏质体的核苷酸组成达到~50%GC含量的平衡。或者,他认为RNA编辑已经影响了这些质体中的GC含量,因为大量富含GC的密码子通过RNA编辑变成了富含AT的密码子。高GC含量、广泛的RNA编辑位点在一定程度上提高了基因组的碱替换速率,但也在一定程度上造成了卷柏科系统发育拓扑结构不稳定性。

编译:刘巧云

预览时标签不可点收录于话题#个上一篇下一篇
分享 转发
TOP
发新话题 回复该主题