首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 984 毫秒
1.
【目的】以欧亚种葡萄‘赤霞珠’(Cabernet Sauvignon)为试材,建立适于葡萄属(Vitis)植物完整叶绿体基因组组装及其特征分析的方法,为研究葡萄属植物的进化和系统发育提供方法指导。【方法】采用Illumina Hi Seq PE150双末端测序策略对其全基因组DNA建库测序,建库类型为350 bp DNA小片段文库,测序深度为10倍。以已发表的拟南芥(Arabidopsis thaliana)和欧亚种葡萄‘黑比诺’(Pinot Noir)的叶绿体基因组序列为参考,通过BLASTN比对提取葡萄叶绿体基因组序列,并用SOAPdenovo软件进行组装,得到‘赤霞珠’完整的叶绿体基因组并对其进行特征分析。【结果】基于高通量Illumina测序,共获得5.2 G的全基因组原始数据,其中,葡萄叶绿体基因组序列为0.42 G,约占全基因组序列的8%。用抽提出来的葡萄叶绿体基因组序列成功组装出‘赤霞珠’完整叶绿体基因组。特征分析表明,叶绿体基因组序列全长160 676 bp,包括大单拷贝区(large single copy,LSC)、小单拷贝区(small single copy,SSC)和2个反向重复序列(inverted repeat,IRA和IRB),长度分别为89 134、19 072和26 235 bp,具有典型被子植物叶绿体基因组环状四分体结构;共注释得到154个基因,包括99个蛋白编码基因、47个t RNA基因和8个r RNA基因;其叶绿体基因组的GC含量为37.43%;共检测到37个串联重复序列(tandem repeat sequence)和53个散在重复序列(dispersed repeats),其中,绝大部分串联重复序列的长度为11—42 bp,占叶绿体基因组序列的0.83%,而散在重复序列占叶绿体基因组序列的5.33%;此外,还检测到50个简单重复序列(simple sequence repeats,SSR)位点,大部分的SSRs均由A或T组成,同时SSRs在‘赤霞珠’叶绿体基因组上的分布是不均匀的,LSC区段含有39个SSRs,而SSC区段和IR区段分别仅有7个和4个SSRs;与蛋白编码基因对应的密码子偏好使用A/T碱基,并且编码亮氨酸(L)的密码子使用频率最高,而编码半胱氨酸(C)的密码子使用频率最低;系统发育分析表明‘赤霞珠’与‘黑比诺’、夏葡萄(Vitis aestivalis)、圆叶葡萄(Vitis rotundifolia)亲缘关系最近。【结论】基于全基因组高通量测序的方法,成功组装出‘赤霞珠’完整的叶绿体基因组,与传统获得叶绿体基因组的方法相比,此方法不需要分离叶绿体和提取cpDNA,缩短了试验时间、降低了劳动强度,并且极大地提高了试验的可行性。‘赤霞珠’叶绿体基因组的基因结构、基因顺序、GC含量和密码子偏好性均与典型的被子植物叶绿体基因组类似。  相似文献   

2.
【目的】分析‘怀玉山’高山马铃薯Solanum tuberosum var. cormosus ‘Huaiyushan’叶绿体基因组特征及密码子使用偏好性,为开展‘怀玉山’高山马铃薯叶绿体基因组密码子优化、叶绿体基因组改造,探索物种进化和增加外源基因表达等研究提供参考依据和理论基础。【方法】采用高通量测序技术对‘怀玉山’高山马铃薯叶绿体基因组进行测序,并利用生物信息学分析软件对组装和注释后的叶绿体基因组进行结构、基因组成及密码子偏好性分析。【结果】‘怀玉山’高山马铃薯叶绿体基因组大小为155 296 bp,为经典的4段式结构。大单拷贝区(LSC)、小单拷贝区(SSC)和反向重复区(IR)长度分别为85 737、18 373、25 593 bp,总鸟嘌呤和胞嘧啶所占的比例(GC比例)为37.88%,共注释出133个基因,包含87个编码区(CDS)基因、37个tRNA基因、8个rRNA基因和1个假基因。‘怀玉山’高山马铃薯叶绿体基因组中共检测到38个简单重复序列位点(SSR位点,36个单碱基重复和2个双碱基重复)和32个长重复序列(16个正向重复和16个回文重复)。‘怀玉山’高山马铃薯叶绿...  相似文献   

3.
【目的】分析黄丹木姜子(Litsea elongata)叶绿体基因组特征,为木姜子属物种鉴定、遗传多样性分析和资源保护提供理论参考。【方法】基于Illumina HiSeq 2000高通量测序平台对黄丹木姜子叶绿体基因组进行测序,利用GeSeq在线工具对叶绿体基因组进行注释,并利用REPuter、MISA、CodonW和IQ-TREE等生物信息学软件对其基因组结构、基因数目、序列重复、密码子使用偏性和系统发育进行分析。【结果】黄丹木姜子叶绿体基因组全长为154028 bp,具有典型的四分结构,编码126个基因,其中蛋白编码基因82个,rRNA基因 8个,tRNA基因 36个。叶绿体基因组的注释基因中,有9个基因含1个内含子,有3个基因含有2个内含子,其余基因均不含内含子;44个基因编码蛋白参与光合作用信号途径,21个基因编码蛋白构成了核糖体大小亚基。黄丹木姜子叶绿体基因组含有32对长序列重复和90个SSR位点,其中,正向重复和回文重复最多,均为12对,反向重复和互补重复分别为6和2对;95.56%的SSR位点位于单拷贝区[大单拷贝区(LSC)和小单拷贝区(SSC)],仅4.44%的SSR位点位于反向重复区(IR)。黄丹木姜子叶绿体蛋白编码基因GC含量为39.14%,GC3s为27.95%,平均有效密码子数(ENC)为49.04,说明其密码子偏性弱;相对同义密码子使用度(RSCU)大于1.00的密码子31个,其中13个以A结尾,16个以U(T)结尾。系统发育进化树分析结果显示,木姜子属的14个物种聚为两组,其中黄丹木姜子和10种木姜子属植物聚在一个组,与日本木姜子的亲缘关系最近。【结论】黄丹木姜子叶绿体基因组结构保守,偏好A或U(T)结尾的密码子,鉴定的SSR位点可用于物种鉴定和群体遗传学研究。  相似文献   

4.
【目的】比较大旗瓣凤仙花和瑶山凤仙花的叶绿体全基因组序列,并分析凤仙花属20个物种的系统发育情况及遗传进化关系,为证实这两个分类群的早期植物学分类及其种质资源利用和遗传改良提供理论依据。【方法】基于BGISEQ-500测序平台,对大旗瓣凤仙花和瑶山凤仙花叶绿体基因组进行测序,利用Fastp软件和NOVOPlasty v.2.6.2程序对叶绿体基因组进行组装。利用CpGAVAS在线工具对叶绿体基因组序列进行注释,并使用MAFFT v.7.0、CAIcal、REPuter、MISA和FastTree等生物信息学软件进行序列比对、密码子偏性分析、重复序列定位及简单重复序列(SSRs)和系统发育分析。【结果】大旗瓣凤仙花和瑶山凤仙花叶绿体基因组长度分别为152437和152286 bp,GC含量分别为36.77%和36.80%;其中大单拷贝(LSC)区分别为83331和83212 bp,小单拷贝(SSC)区分别为17376和17312 bp,反向重复区(IRa和IRb)分别为25865和25881 bp。大旗瓣凤仙花和瑶山凤仙花叶绿体基因组均包含88个蛋白编码基因、8个rRNA基因和37个t RNA基因,且无假基因。系统发育分析结果表明,凤仙花属内的物种分类与基于系统形态学分析的早期植物学分类一致;虽然大旗瓣凤仙花和瑶山凤仙花叶绿体基因组非常接近,但二者为不同的凤仙花属种类,而不是早期形态分类学上的两个亚种水平。【结论】大旗瓣凤仙花和瑶山凤仙花为2个独立的凤仙花属种类,二者叶绿体基因组发生部分遗传变异,鉴定出的SSRs位点可用于物种鉴定和群体遗传学研究。  相似文献   

5.
为探明叶菜型甘薯叶绿体基因组特征及其与番薯属植物的亲缘关系,以叶菜型甘薯‘福菜薯18号’为试验材料,利用BGISEQ-500平台和Oxford Nanopore Technologies单分子测序技术对全基因组进行建库测序,并组装其叶绿体基因组.结果显示:叶菜型甘薯叶绿体基因组全长161 387 bp,具有典型的环状四分体结构,其大单拷贝区(large single copy, LSC)、小单拷贝区(small single copy, SSC)和2个反向重复序列(inverted repeat, IR)的长度分别为87 597, 12 052和30 869 bp.注释共得到132个基因,包含87个蛋白编码基因,8个rRNA基因,37个tRNA基因.在叶菜型甘薯叶绿体基因组中共搜索到54个SSR位点,其中单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复基序个数分别为32, 4, 3, 11, 2和2个.系统进化分析表明,叶菜型甘薯与甘薯四倍体野生种Ipomoea tabascana和二倍体野生种Ipomoea trifida具有较近的亲缘关系.  相似文献   

6.
为探究老班瑶药牛耳风叶绿体基因组的结构特征、系统进化以及密码子偏好性,以瑶药牛耳风为研究材料,对其叶绿体基因组进行测序和组装。结果表明,牛耳风叶绿体基因组由大单拷贝区、小单拷贝区以及1对反向重复区组成,全长189 920 bp,包含118个基因,其中99个编码蛋白质的基因,11个tRNA基因,8个核糖体rRNA基因;共检测到71个简单序列重复(simple sequence repeat, SSR)位点。系统进化分析表明牛耳风与番荔枝属的刺果番荔枝(Annona muricata)亲缘关系最近。密码子偏好性分析表明,牛耳风的密码子偏好性较弱,且密码子偏好性主要受选择因素的影响,最终选出11个最优密码子,其中10个以A/U结尾,为瑶药牛耳风的系统进化研究等提供科学依据。  相似文献   

7.
【目的】阐明药食两用植物五指毛桃的叶绿体基因组结构及其系统进化关系,为其资源利用和产品开发等研究提供基因组信息。【方法】采用高通量测序技术对五指毛桃叶绿体基因组测序,并借助生物信息工具和软件进行序列拼接、注释、比对和系统进化分析。【结果】五指毛桃叶绿体基因组为环状双链四分体分子,长度160 340 bp, GC含量为35.9%,包含130个基因。该基因组含有26 679个密码子,偏好使用以A/T结尾的密码子;共有93个简单重复序列,其中以A/T形成的单、二核苷酸重复为优势重复基序。五指毛桃与其他榕属植物相比,叶绿体基因组序列同源性较高,碱基变异位点数量较少,主要分布在非编码区域如rpoB-trnC、trnT-trnL、rpl32-trnL等,与薜荔具有最高的序列相似度。【结论】五指毛桃叶绿体基因组具有典型的高等植物叶绿体基因组结构和基因组成,存在密码子偏好性,包含类型丰富的简单重复序列,且与同属植物薜荔的亲缘关系最近。  相似文献   

8.
蒿属植物具有重要的药用和经济价值,开展蒿属物种叶绿体基因组研究,为我国蒿属植物的分类鉴定和资源利用提供借鉴。基于29个蒿属物种叶绿体基因组序列,采用REPuter、MISA、DNASP和IQ-TREE等生物信息学软件,比较叶绿体基因组特征、序列重复和结构变异,并对蒿属物种系统发育进行分析。结果表明,蒿属叶绿体基因组均由大单拷贝(LSC)区、小单拷贝(SSC)区和1对反向重复(IRs)区构成,基因组序列长度150 858~151 318 bp, GC含量相近。所有蒿属叶绿体基因组均注释到114个unique基因,包含80个蛋白编码基因、30个tRNA基因和4个rRNA基因。蒿属叶绿体基因组长重复序列主要由正向重复和回文重复构成,长度30~49 bp。简单重复序列(SSR)主要由A/T碱基构成,其中单碱基重复最多,其次为四碱基重复。RSCU(相对同义密码子使用度)值大于1的30个高频密码子中,13个以A结尾,16个以T结尾。蒿属植物叶绿体基因组结构高度相似,未检测到基因重排或倒置事件。检测到11个核苷酸变异值Pi>0.007的高变区,其中8个位于LSC区,3个位...  相似文献   

9.
利用数据库中大白菜的部分基因组序列及其注释结果,对大白菜功能基因编码区分布的SSRs类型进行了分析。结果表明,编码区的SSRs以3核苷酸重复的最多,其次为6核苷酸重复的;各种基序的SSRs类型在基因编码区分布的数量有很大差异;另外编码氨基酸的三核苷酸SSRs在11944个基因编码区前100bp、中部及后100bp的分布也有较大差异。说明大白菜基因编码区的SSRs具有相位和极性,其原因在于编码氨基酸的需要。正是这种相位和极性引起大白菜基因编码区SSRs分布的不均一性。  相似文献   

10.
为明确抱茎金花茶(Camellia tienii)的叶绿体全基因组序列,本研究对抱茎金花茶的叶片高通量重测序数据进行叶绿体全基因组的组装和注释分析。抱茎金花茶叶绿体全基因组长为156 591 bp,是典型的四分体结构,大单拷贝区(LSC)为86 172 bp、小单拷贝区(SSC)为18 275 bp、反向重复区(IRs)为26 072 bp,序列已登录GenBank(OL435568)。抱茎金花茶叶绿体基因组共预测注释134个基因,包括88个蛋白编码基因、38个tRNA基因、8个rRNA基因。叶绿体全基因组比较分析表明,抱茎金花茶结构与基因排序均保守,rps16、ycf3、ycf4-cemA、ycf15-trnL-CAA和rrn5-trnR-ACG序列可作为开发金花茶植物DNA条形码研究热点。抱茎金花茶cpDNA中共有67个SSR位点,其中单核苷酸、二核苷酸、三核苷酸、四核苷酸、六核苷酸重复数分别为48、4、1、11、2个。系统发育分析表明,抱茎金花茶在金花茶组中形成基部分支,和金花茶、显脉金花茶等互为姐妹类群,具有较近的亲缘关系。  相似文献   

11.
以7种睡莲属植物叶绿体基因组为研究对象,分析其叶绿体基因组的密码子使用偏好性,探讨影响其密码子偏好性形成的主要因素。结果表明,7种睡莲叶绿体密码子使用偏好性相似,基因组序列富含A/T碱基,密码子第3位碱基以A/T结尾为主;有效密码子数(ENc)分别为40.14~61.00、40.14~61.00、40.55~57.61、39.77~57.61、39.55~57.30、39.56~61.00和40.10~61.00,均明显大于35,表明其密码子使用偏好性较弱。ENc-plot、PR2-plot和中性绘图分析表明,它们的叶绿体密码子偏好性形成受自然选择、碱基突变等多种因素共同影响,其中自然选择起主导作用。通过同义密码子RSCU值分析,发现以A/T结尾的高频密码子27个,以G/C结尾的低频密码子26个,进一步依据密码子RSCU和△RSCU值,最终确定出4个最优密码子。此外,基于7种睡莲叶绿体基因组密码子使用偏好特征RSCU值、CDS序列及其全基因组序列分别构建系统进化树,分析发现3种方法构建的物种间进化关系相似,均划分为2大分支,其中Nymphaea alba var.rubraNymphaea alba、Nymphaea ampla、Nymphaea capensis、Nymphaea jamesonianaNymphaea lotus划归第1分支,Nymphaea mexicana单独形成第2分支。研究结果进一步支持了物种内遗传关系与密码子使用偏好性之间存在一定关系。  相似文献   

12.
为了解铁皮卡叶绿体基因组密码子的使用特征及其成因,以筛选的52条蛋白编码序列为研究对象,利用CodonW和CUSP在线软件对其密码子使用特征进行系统分析。结果表明,基因组各位置的GC含量GC1、GC2、GC3分别为47.47%、39.52%、27.92%,30个高频密码子中,以U结尾占比53.33%,以A结尾占比43.33%,以G结尾占比3.33%,说明铁皮卡叶绿体基因偏好使用NNA 和NNU 型密码子,尤其偏好使用NNU型密码子。有效密码子数(ENC)、密码子适应指数(CAI)、最优密码子频率(Fop)分别为46.85、0.167、0.352,均揭示该基因组的密码子偏性较弱。中性绘图、ENC-plot、PR2-plot以及对应分析揭示密码子的偏好性受到选择及其他因素共同作用,最终确定了AUU、GUU和UCU等20个最优密码子。表明铁皮卡叶绿体基因组密码子的偏性较弱,偏好AU结尾的密码子。密码子的使用偏好性受到突变及选择等多种作用共同影响。  相似文献   

13.
[目的]分析香蕉基因组的密码子组成及使用偏好性,探讨影响密码子偏好性形成的主要因素,为提高香蕉外源基因的表达水平及转基因抗病育种提供参考.[方法]以香蕉基因组的36242条高置信蛋白编码基因CDS序列为研究对象,运用CodonW 1.4.4统计分析香蕉基因组的密码子组成及使用参数,确定最优密码子,并分析密码子使用参数间相关性.[结果]从香蕉基因组数据中筛选获得36242个高置信蛋白编码基因CDS序列,平均长度为1035 bp,GC含量为3.0%~75.8%,其中低于20.0%的仅13个序列,全基因组中GC总含量为50.4%;同义密码子第3位出现G或C的频率为52.9%,比出现A或T的频率高.香蕉基因组的有效密码子数(ENC)介于20.0~61.0,平均为50.7;共有17个最优密码子,其中有15个密码子的第3位是G或C;基因编码区的长度和ENC存在正相关,随着基因编码区长度的增加,对以G或C结尾的密码子使用偏好性逐渐降低,且编码区长度为400~600 bp的基因具有较高的基因表达水平.[结论]香蕉基因组中多数基因的密码子使用偏好性较弱,但少部分基因具有强偏好性,偏好使用以G或C结尾的密码子,且偏好性受核苷酸组成、基因突变及自然选择等因素的影响.  相似文献   

14.
以云南蓝果树叶绿体基因组为研究对象,采用Codon W 1.4.2等软件,通过分析云南蓝果树叶绿体基因组52个基因密码子的偏好性,探究影响密码子使用偏性形成的主要因素。结果表明:1) Codon W和CUSP软件分析显示密码子第3位碱基GC含量为28.40%,ENC值>45的基因有39个,说明密码子偏好以AT结尾,且存在较弱偏性。2)中性绘图分析显示,GC12与GC3的相关系数为0.161 2,相关性不显著,说明密码子第1、第2位与第3位碱基组成存在显著差异。3) ENC绘图结合ENC比值频率表显示,大部分基因距离标准曲线较远,说明密码子偏好性主要受选择的影响。4) PR2-plot分析显示密码子第3位碱基使用频率方面,T>A,G>C,说明密码子偏好性受多重因素影响。5) 确定UUG、UCA、GCU、AAU、GAU和GGA为最优密码子。综上所述,云南蓝果树叶绿体基因组密码子的使用主要受选择的影响,受其他如突变等因素的影响较弱。  相似文献   

15.
【目的】探究H9N2禽流感病毒(AIV)全基因组的密码子使用偏好性及影响因素。【方法】选取2010—2018年国内H9N2 AIV流行毒株的全基因组为研究对象,分析其碱基组成特性、最优密码子、密码子使用偏好性的影响因素以及病毒对宿主密码子使用模式的适应性。【结果】H9N2 AIV的全基因组中AU含量高于GC。大部分最优密码子以A或U结尾,有效密码子数(ENC)平均值为52.86,提示存在密码子使用偏好性但偏好性较低。密码子使用偏好性主要受到突变压力和自然选择的共同作用,其中自然选择(所占比例为61.79%~76.15%)作用大于突变压力(所占比例为23.85%~38.21%)。H9N2 AIV对人Homo sapiens的密码子适应指数平均值为0.739~0.741,提示H9N2AIV禽流感病毒可能已适应人类的密码子使用模式。【结论】本研究为H9N2 AIV的基因进化分析、已有疫苗的密码子优化和新型疫苗(密码子去优化疫苗)研制提供了理论依据。  相似文献   

16.
为确定槭属樟叶槭叶绿体基因组密码子使用模式和原因,通过对樟叶槭叶绿体基因组中筛选的53条基因序列进行中性绘图、ENC-plot与PR2-plot等分析,确定樟叶槭叶绿体基因组密码子偏好性基本特征与其最佳密码子的构成,分析过程中主要使用Codon W 1.4.2、CUSP、R等软件。结果表明,共有28个密码子,且均以A或U结尾,说明樟叶槭叶绿体基因组密码子对A/U结尾偏好。密码子第1、2和3位上的GC平均含量分别为47.04%、39.56%与29.66%,GC平均含量为38.75%,ENC范围在37.60~57.16,其中ENC小于45的只有11个,表明樟叶槭叶绿体基因组密码子存在较弱的偏性。PR2-plot绘图分析显示多数位点偏离中心,落于右下方位置;最优密码子确定为UGU、CAA、GUU等15个最优密码子。该结果为槭属植物叶绿体基因组进化与转化体系中载体构建研究提供参考依据。  相似文献   

17.
为了解马TBX3基因的密码子使用特性,为选择该基因最佳的受体以及合适的异源表达系统提供依据,利用CHIPS、CUSP、Codon W等软件对NCBI公布的马TBX3基因(GenBank登录号为XM_014742147.1)的密码子使用情况进行分析,并将其与马的10个肢体生长和肢体形态形成相关基因、模式生物基因组以及其他物种TBX3基因进行比较。结果表明:马TBX3基因偏好使用G/C结尾的密码子,存在19种偏好使用的密码子(RSCU1.20),其中:GCC、CTG、AGC和GTG偏好性较强(RSCU2.00);10个马相关基因在20种偏好密码子中偏好性较强的只有CTG,17种密码子偏好G/C结尾;通过比较30种动物的TBX3基因密码子偏好性,发现其TBX3基因表达水平一般,并且密码子偏好G/C结尾;基于RSCU值和CDS序列的聚类分析发现,奇蹄目的家马与食肉目的家猫、北极熊聚在一起,可见系统进化树更接近这30个物种的真实系统分类;在密码子的使用频率上,小鼠更适合作为马TBX3基因的外源表达宿主。本研究可为TBX3基因在动物遗传育种改良中选择适合的宿主动物、筛选最佳的外源表达系统以及提高其表达水平提供依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号