首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
马尾松转录组测序和分析   总被引:7,自引:0,他引:7  
本研究首次构建了马尾松均一化cDNA文库,采用Illumina高通量测序技术对转录组进行了测序,利用生物信息学方法开展基因表达谱的研究、功能基因的预测。EST序列拼接获得83680个contig,其中33772个contig被注释为相应的331669对生物学功能,10647个contig被注释具有酶功能。根据KEGGpathway数据库,对马尾松转录组的contig进行Pathway生物学通路的注释和预测,共识别出10647个contig具有对应的1029种酶功能,并关联到135条生物学通路。SSR查找发现,从83680个contig中找到889个SSR位点,占contig总数的比例为1.06%。其中,三核苷酸重复所占比例最高,达到48.37%,其次是六核苷酸重复,为19.12%,比例最低的是四核苷酸重复,仅为4.72%,二核苷酸重复和五核苷酸重复基本相同,分别为14.62%和13.16%。SSR不同重复基元类型中,出现频率最高的为AT/AT,其次是AGC/CTG和AAG/CTT。  相似文献   

2.
本研究利用Illumina HiSeq~(TM)2000对马蓝转录组进行高通量测序,使用软件MicroSAtellite (MISA)分析转录组中的SSR位点信息。通过组装马蓝转录组数据获得了51 381条Unigene,并对获得的Unigene进行SSR检测,共检测到8 471个SSR位点,其分布在6 782条Unigene中,出现的频率为16.49%。SSR中以二核苷酸和三核苷酸重复类型为主,其中二核苷酸以重复单元AT/TA为主,占18.14%,其余类型的重复单元相对较少。SSR所在序列功能注释结果显示在Nr和SwissProt中分别有5 932和4 285条序列被注释,同时SSR所在序列还被注释到47个GO分类,25个KOG分类和29个KEGG代谢通路中。通过设计、筛选,共获得5 819对引物组合,随机挑选的18对引物中有13对引物扩增出符合预期大小的条带。马蓝SSR出现的频率高,重复种类丰富,为研究马蓝遗传多样性、基因定位和品质改良等提供了科学依据。  相似文献   

3.
基于高通量测序的金钗石斛叶转录组数据分析   总被引:2,自引:0,他引:2  
本研究采用Illumina Hiseq4000对金钗石斛(Dendrobium nobile)叶转录组进行测序,共获得5.6 Gb数据。组装并去冗余后得到61 998个Unigene,其总长度,平均长度,N50以及GC含量分别为53 773 338 bp、867 bp、1 482 bp和43.09%。将Unigene比对到七大功能数据库进行注释,最终分别有34 250(NR:55.24%),28 010(NT:45.18%)、22 029(Swissprot:35.53%)、13 384(COG:21.59%)、25 754(KEGG:41.54%)、7 731(GO:12.47)以及25 407(Interpro:40.98%)个Unigene获得功能注释。在KEGG数据库中,注释上的与碳水化合物代谢、萜类和黄酮类化合物代谢、以及多糖合成相关的Unigene分别有2 819个、706个和559个。根据注释结果共检测出34 096个CDS,未注释上的Unigene使用ESTScan预测后获得2 108个CDS。检测出7 165个SSR分布于6 264个Unigene中,其中在不同重复基序类型中,出现频率最高的为AG/CT,其次是AAG/CTT、AT/AT和AGG/CCT。同时,预测出1 234个编码转录因子的Unigene。该转录组测序分析为金钗石斛次生代谢和转录组方面研究提供了一定的理论参考。  相似文献   

4.
为了开发马尾松SSR标记,本研究利用MISA软件对马尾松转录组测序获得的148 186条Unigene (序列总长约91 449.7 kb)进行全面分析,共搜索获得6 611个SSR位点,分布在6 003条Unigene上,SSR发生频率为4.05%,平均每13.83 kb出现1个SSR,结果发现单核苷酸重复出现的频率占总SSR的53.60%;二核苷酸为23.46%;三核苷酸为21.33%。通过对含SSR的Unigene的GO分析,显示生物过程包含的Unigene占40.60%;细胞组分包含的Unigene占35.45%,分子功能包含的Unigene占23.95%;转录组中有724个Unigene可被注释到110个KEGG通路中,其中被注释到新陈代谢的Unigene最多有312个,其次是遗传信息处理类有183个。根据含SSR的Unigene序列共设计了4 247对SSR引物,并随机挑选30对SSR引物进行PCR扩增验证,其中12对引物能够扩增出目标条带,引物的有效性为40%。本研究结果表明,马尾松转录组测序获得的Unigene序列可作为SSR标记开发的有效来源,所开发的SSR标记为马尾松的遗传图谱构建、分子标记辅助育种等研究提供丰富可靠的标记。  相似文献   

5.
大花序桉(Eucalyptus cloeziana)是中国重要用材林树种,但目前对其生物信息学研究缓慢,在一定程度上限制了大花序桉分子育种以及品种改良。采用Illumina Hi Seq TM 2000高通量测序平台对1年生大花序桉根系转录组测序和de novo组装,将得到的Unigene与公共数据库比对,同时进行转录组分析。结果显示,组装获得53 433条Unigene,其平均长度890 bp,N50长度为1 587 bp;有34 700条Unigene获得注释信息,占全部Unigene的64.94%,其中19 327条Unigene注释到KOG数据库,被分到25个类别中,共得到32 302个KOG功能注释信息;有11 197条Unigene注释到GO数据库中,共获得了54 971个GO注释功能,归于细胞组分、分子功能和生物学过程三大类;有12 181条Unigene得到KEGG注释,其中6 493条Unigene归入128条代谢途径,发现有57条Unigene参与氮代谢途径。通过软件查找获得13 290个SSR位点,二核苷酸重复类型占的频率最高,其次是三核苷酸、四核苷酸和六核苷酸,五核苷酸重复频率最低。本研究首次对大花序桉转录组进行分析,为深入开展大花序桉分子生物学研究提供基础数据来源。  相似文献   

6.
本研究基于RNA-Seq技术建立了一个由3个甘蔗原始亲本和8个不同来源的甘蔗栽培品种/系构成的甘蔗参考转录组,并进行生物信息学相关分析。研究结果表明:对供试材料+1叶RNA混合样本进行转录组测序,可组装出98 945条Contig,从中找到5 806个SSR位点,其中三核苷酸重复最多、六核苷酸重复最少,CCG/CGG出现的频率最高。进一步处理Contig获得75 656条Unigene,将所有的Unigene与Nr数据库、Swiss-Prot数据库、KEGG数据库和COG数据库进行Blast,有53 951条Unigene得到注释。在Nr和KEGG注释结果基础上,对Unigene进行GO和KEGG功能分类,分别获得44个功能小组和123个Pathway注释。研究结果可为研究甘蔗在不同时空条件下的差异基因表达奠定基础。  相似文献   

7.
为了解白掌株型突变的转录组序列功能和SSR位点分布特征,并探索与株型关联的SSR位点信息。以对照‘美酒’及其小株型突变体为材料,选取叶片、叶柄、佛焰苞片、苞梗组织进行高通量PE150的转录组测序和序列筛选;开展unigene的GO、KOG、KEGG功能注释及分类;开展SSR位点筛选及批量设计引物;发掘差异表达含SSR位点unigene的GO、KEGG富集功能信息。结果显示,白掌转录组共筛选127 153个unigene,其中有41 370个获注释,包含GO注释25 925个、KO注释12 727个、KOG注释21 487个;从18 636个unigene中发掘出28 046个SSR位点,出现频率22.06%,包含有193种重复基序,其中以二核苷酸AG/CT(14 305, 51.01%)、AC/GT (3 907, 13.93%)、AT/AT (2 322, 8.28%)和三核苷酸AAG/CTT (2 087, 7.44%)居多,基序重复次数以5~10次重复占优势;从18 636个unigene中筛选17 070个批量设计出51 210对SSR引物,有效扩增和多态性好。差异转录组结合S...  相似文献   

8.
采用Illumina测序技术对在醋酸钙、硫酸铵和蔗糖处理后蓝莓不同发育阶段的果实进行转录组测序,获得Clean Reads 2723731442条,经组装得到平均长度为753.65 nt的87608条Unigene。将转录组Unigene进行基因功能注释,其中39867条Unigene能被NR数据库注释,与葡萄同源序列最多,占8.58%;与GO数据库比对发现,有29661条Unigene获得注释,分别匹配到生物过程、细胞组成和分子功能三大类共59个分支;与KOG数据库进行比对,发现有21992条Unigene具有功能信息,分别涉及25类;根据KEGG数据库的注释信息进行Pathway注释,参与的代谢通路共有246条;共检测到8704个SSR位点,其中双碱基重复的SSR占78.57%。本研究为探索外源物质调控蓝莓果实生长发育、生理代谢的分子机理提供了理论基础。  相似文献   

9.
《分子植物育种》2021,19(16):5342-5351
为了获得珍贵用材树种大花序桉顶芽转录组数据及预测关键基因功能,本研究基于Illumina HiSeq X Ten测序技术获得大花序桉顶芽转录组原始数据,经Trinity组装拼接获得高质量Unigene,并与NR、Swiss-Prot、GO、KOG、egg NOG和KEGG等生物信息数据库进行序列比对和功能注释,利用MISA软件进行SSR位点搜索和分析。从大花序桉顶芽中共获得26 587条高质量Unigene,平均长度为1 279.69 bp;共有22 099条Unigene至少在一个数据库中被成功注释,其中,11 507条Unigene被注释到KOG数据库中25个功能类别,以参与一般功能基因的数量最多;GO数据库中,所注释到的14 105条Unigene分别匹配到生物功能、细胞组分和分子功能3大类50个功能基因区,其中执行生物过程所占比例最多;KEGG功能注释共发现有7 117个Unigene参与127条代谢通路,以代谢相关的基因最丰富;共有1 021条Unigene注释到转录因子数据库,分布于65个家族,其中比例最大的是bHLH和MYB家族;3 274条Unigene注释到植物抗性基因数据库,分布于13个类别,相匹配基因数量最大的是RLP和TNL。MISA软件共检测到12 366个SSR位点,分布密度为1/2.75 kb,重复基元类型丰富,标记开发潜力大。本研究利用高通量测序获得丰富的顶芽转录组信息,可以为大花序桉分子辅助育种提供丰富的资源。  相似文献   

10.
扁秆荆三棱是一种常见的稻田杂草,旨在补充其转录组信息,为相关防治工作提供支持。基于高通量测序技术,在Illumina Solexa HiSeq 2000平台上对扁秆荆三棱的茎、叶、根茎和球茎的混合样品进行转录组分析。经拼接组装共获得了59 788个Unigene,序列的平均长度842 bp,N50为1 402 bp。将获得的Unigene与5个通用公共数据库(NR、 Swiss-Prot、 KEGG、 GO、 KOG)进行比对(Evalue1e-5),35 221条Unigene获得了基因注释,占总Unigene的58.91%。在12 823个Unigene中共搜索到9 698个SSR位点,其中二核苷酸和三核苷酸的重复类型占所有SSR位点的95.93%。通过KEGG pathways分析,共有13 141个Unigene参与了291个代谢通路,获得了扁秆荆三棱淀粉合成功能相关Unigene 60个,根茎生长功能相关Unigene 14个。其中赤霉素相关基因、核糖体代谢通路等反映了地下根茎网络系统的扩张趋势以及活跃的能量需求,淀粉合成基因则说明其球茎中的营养储备开始于地下系统扩张的早期,这些发现为深入研究地下根茎网络调控机制,或杂草防治或湿地保护等实践工作提供了参考。  相似文献   

11.
基于高通量测序的铁皮石斛叶片转录组分析   总被引:1,自引:0,他引:1  
采用新一代高通量测序技术Illumina Hi Seq 2000对铁皮石斛(Dendrobium officinale)转录组进行测序,共获得11 153 295 000 nt数据。对测序获得数据(reads)进行序列拼接组装,共获得121 596个单基因簇,序列平均长度为660 bp,整体序列信息达到了40.16 Mb。再应用生物信息学相关数据库进行比对,结果表明,本测定获得的52 345个Unigene能够在数据库中检索到相关功能注释。通过GO数据库比对,测序获得Unigene功能分类可分为3大类57个分支,其中有大量的Unigene与细胞、催化活性、细胞部分、细胞器等相关功能。通过COG数据库比对,测序获得Unigene功能注释到25类直系同源蛋白分类中如转录、复制,重组和修复、翻译,核糖体结构和生物起源等。以KEGG数据库作为参考,依测序获得Unigene可定位到128个代谢途径分支,如脂类代谢、氨基酸代谢、碳水化合物代谢等。进一步利用软件查找SSR位点发现,从Unigene中共找到9 892个SSR位点。SSR不同重复基序类型中,出现频率最高的为AG/CT,其次是AAG/CTT、CCG/CGG和AGG/CCT。  相似文献   

12.
柳杉是中国南方重要的针叶用材树种,具有树形高大,纹理直等特点,已广泛用于板材和建筑生产中,研究柳杉木材形成过程中维管形成层及木质部区转录组特征,为木材形成主要过程的分子机理,木材形成有关基因调控,培育优良材质的林木提供理论参考。本研究以柳杉形成层组织为材料,通过Illumina Hiseq测序平台对4个不同发育阶段的柳杉维管形成层进行转录组测序;对Unigene进行了蛋白功能注释、分类及KEGG代谢通路分析等。测序数据参照无参转录组测序流程进行分析,一共产生105.9 Gb的数据,过滤后Clean reads均达到90%以上。Clean reads经Trinity软件进行组装,一共产生64 969个Unigene,对Unigene进行拼接,拼接后的Contigs序列有29 381条、Singletons有35 588条,总长度为83 003 836 bp。将Unigen与七大功能数据库(NR, NT, GO, COG, KEGG, Swissprot, Interpro)进行比对,共有42 836个Unigene得到注释,占总Unigene的66.05%。GO注释共有89 644个转录本得到注释。对GO注释转录本进行分类,其中有38 432个转录本(42.87%)注释为生物过程,有32 749个转录本(36.53%)注释为细胞组分,有18 463个转录本(20.6%)注释为分子功能。KEGG注释有31 580个Unigene得到注释。分为6大类为:细胞代谢过程、环境信息处理、遗传信息处理、人类疾病、代谢作用、生物体系统。其中代谢作用涉及的Unigene最多达18 580个,占KEGG总注释Unigene的58.83%。另有37 762个Unigene得到COG注释,被分为25类,其中注释数目最多的类型是仅预测一般功能的Unigene,占总数的16.9%;其次是转录,比例为8.8%;再次是复制、重组及修复,占总数的7.8%。本研究最后分析了可能参与木材形成重要功能基因,为探讨木材发育的分子机制及进行重要功能基因的挖掘提供了提供了依据。  相似文献   

13.
为了获得罗布麻转录组信息,研究罗布麻中功能基因的表达以及分子标记的开发,本研究采用Illumina HiSeq2000高通量测序技术对罗布麻进行转录组测序及分析。通过过滤掉低质量的读序,共获得26148138个高质量的读序,组装得到61538个Unigene序列。其中,有25296个Unigene在公共数据库中得到注释。通过KEGG分析,共发现29个Unigene参与活性成分(黄酮类)生物合成。检测出单核苷酸至六核苷酸重复类型的SSR位点13524个。本研究结果分析了参与黄酮类化合物合成的相关基因以及潜在的SSR位点,为进一步研究罗布麻次生代谢产物合成的功能基因的挖掘、分子标记的开发以及资源利用提供有用的信息。  相似文献   

14.
《分子植物育种》2021,19(7):2273-2278
采用生物信息学方法对槟榔(Areca catechu L.)果实转录组中的SSR位点信息进行分析,以期为槟榔SSR标记开发提供依据。利用MISA工具对槟榔转录组测序获得的Unigene序列进行SSR检索、位点信息分析和SSR引物设计。从94 562条Unigene中共检索到51 245个SSR位点,分布在31 482条Unigene序列中,平均分布距离为1/2.12 kb,发生频率为54.19%。单核苷酸是主要重复类型,所占比例为30.14%。优势重复基元是A/T、AG/TC、GA/CT和TA/AT,分别占单核苷酸的80%、二核苷酸的27%、26%和25%。重复次数以3~11次重复为主,所占比例为69.37%。大部分基序长度集中在12~20 bp之间,所占比例为92.77%。设计获得34 983对SSR引物。研究结果表明槟榔SSR位点分布频率较高、类型丰富、具有较高的多态性潜能和可用性,可为槟榔SSR标记开发、种质资源鉴定、遗传多样性分析、分子标记辅助育种等方面提供的理论基础。  相似文献   

15.
为了研究牡丹、芍药远缘杂交胚败育的分子机理,本研究使用BGISEQ-500平台对牡丹、芍药杂交种胚转录组进行测序,通过测序,共得到了92.02 Gb数据。通过拼接组装去冗余后得到了86 195个Unigene,平均长度为1 189 bp。86 195个Unigene在七大功能数据库中进行注释,最终分别有49 172 (NR:57.05%)、38 352(NT:44.49%)、36 477 (Swiss Prot:42.32%)、38 905 (KOG:45.14%)、37 993 (KEGG:44.08%)、26 832 (GO:31.13%)以及37 758 (Pfam:43.81%)个Unigene获得功能注释。同时还检测出21 998个SSR分布于17 567个Unigene中,其中二核苷酸和三核苷酸这两种重复类型分别有5 628个和2 906个。在17 567个Unigene中预测出1 671个编码转录因子。不同发育时期的胚转录组数据中共筛选出13 974个差异表达基因,其中上调基因有8 647个,下调基因有5 327个。该转录组测序分析为寻找牡丹、芍药远缘杂交胚败育相关基因提供了一定的理论参考。  相似文献   

16.
利用Illumina NovaSeq 6000对云南栘(木衣)进行高通量转录组测序,使用MIcro SAtellite identification tool (MISA)分析转录组中SSR位点分布类型与特征。组装获得云南栘(木衣) 111 655条Unigene,并搜索检测到32 360个SSR位点,出现频率为28.98%,分布平均距离为3.76 kb。其中以二核苷酸所占比例最高(46.75%),其次是单核苷酸(34.70%)和三核苷酸(17.10%)。在单核苷酸的重复类型中,A/T重复基元占有较大比例(33.01%);二核苷酸各重复类型所占比例差距较大,分别为:AG/CT (39.76%)AT/TA (3.71%)AC/GT(3.20%)CG/CG (0.09%);三核苷酸各重复类型及其所占比例依次为AAG/CTT (4.52%)、AGG/CCT (3.51%)、ACC/GGT (2.33%)、AGC/CTG (2.28%)和ATC/ATG (1.20%),而AAC/GTT、AAT/ATT、ACG/CGT、ACT/AGT、CCG/CGG基元所占比例较低。在云南栘(木衣)转录组中,由于云南栘(木衣) SSR具有高出现频率,高重复类型和高多态性,为其SSR开发和遗传多样性分析等研究提供科学的数据参考。  相似文献   

17.
白芨转录组特性分析   总被引:1,自引:0,他引:1  
白芨(Bletilla striata)具有较高的药用、经济和观赏价值,但是其基因组和转录组序列未知,严重影响了其的研究开发和利用。本研究采用His4000测序平台对白芨的全株进行了转录组测序分析,共获得原始数据6.8 G,有效数据6.7 G,243 410条Unigene,经过与NR、GO、KOG及KEGG等数据库进行比较分析后,83 541条Unigene被注释到NR数据库,50 178条Unigene被注释到GO数据库,10 007条Unigene在KOG数据库获得注释,43 637条Unigene在Swissprot数据库获得注释,15 321条被注释到KEGG代谢途径中,2 021条Unigene参与了糖类代谢,1 309条Unigene参与了氨基酸合成和代谢,120条Unigene参与了萜类合成,106条转录因子与代谢相关;微卫星位点有31 958个,其中单核苷酸最多,15 709个,占49.16%,其次为二核苷酸和三核苷酸,分别有9 145个和7 104个,占28.62%和22.23%。本研究为白芨的重要功能基因挖掘、遗传育种及其研究开发提供了参考和依据。  相似文献   

18.
本研究利用Illumina HiseqTM4000测序平台对柚木(Tectona grandis L. F.)边材组织进行转录组测序,获得39.65 Gb的数据。拼接组装共得到90 843个Unigene,平均长度、N50以及GC含量分别为1 415 bp,2 208 bp和41.28%。将获得的Unigene与七大功能数据库进行比对,分别有64 416 (NR:70.91%)、69 281 (NT:76.26%)、28 777 (COG:31.68%)、18 630 (GO:20.51%)、49 594 (KEGG:54.59%)、44 707 (Swissprot:49.21%)以及50 938 (Interpro:56.07%)个Unigene获得功能注释。经过GO数据库的比对分析,18 630个Unigene被注释到生物过程、细胞组分和分子功能3大类别55个亚类。与COG数据库进行比对分析,28 777个注释Unigene按功能被划分为25类。基于KEGG数据库,44 595个Unigene序列注释到6大类,21个亚类代谢通路中。根据注释结果预测出2 772个编码转录因子的Unigene,检测出26 773个SSR位点,以及39 856个SNP位点。本研究为柚木分子育种工作的开展提供数据和参考。  相似文献   

19.
20.
为推动野鸦椿(Euscaphis japonica)遗传多样性研究,以福建乡土树种野鸦椿的转录组序列为基础,对野鸦椿SSR位点进行挖掘。结果表明:通过MISA软件从野鸦椿169 224条Unigenes序列检测出47725个SSR位点,分布于38 802条Unigene中,出现频率为28.20%,平均分布距离为2.46 kb。优势重复基序为单核苷酸、二核苷酸和三核苷酸,分别占总SSR位点的70.27%、18.98%和8.81%。47 725个SSR位点由100种重复基序构成,A/T、AT/AT、AAT/ATT分别是单核苷酸及二、三核苷酸的优势重复基元,分别占总SSR重复类型的70.17%、8.46%和3.12%。基因GO功能分类表明,含有SSR位点的野鸦椿转录组基因被富集到3个Ontology类别的56个GO Term中,生物学过程涉及的GO Term最多,有25个。利用Primer 3.0对SSR序列设计引物26 554对,成功率为55.64%。野鸦椿转录组SSR位点丰富,分布密度大,具有较高的多态性潜能,可作为开发SSR标记的有效来源,为野鸦椿遗传多样性研究、品种鉴定、分子辅助育种...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号