首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 218 毫秒
1.
《分子植物育种》2021,19(16):5342-5351
为了获得珍贵用材树种大花序桉顶芽转录组数据及预测关键基因功能,本研究基于Illumina HiSeq X Ten测序技术获得大花序桉顶芽转录组原始数据,经Trinity组装拼接获得高质量Unigene,并与NR、Swiss-Prot、GO、KOG、egg NOG和KEGG等生物信息数据库进行序列比对和功能注释,利用MISA软件进行SSR位点搜索和分析。从大花序桉顶芽中共获得26 587条高质量Unigene,平均长度为1 279.69 bp;共有22 099条Unigene至少在一个数据库中被成功注释,其中,11 507条Unigene被注释到KOG数据库中25个功能类别,以参与一般功能基因的数量最多;GO数据库中,所注释到的14 105条Unigene分别匹配到生物功能、细胞组分和分子功能3大类50个功能基因区,其中执行生物过程所占比例最多;KEGG功能注释共发现有7 117个Unigene参与127条代谢通路,以代谢相关的基因最丰富;共有1 021条Unigene注释到转录因子数据库,分布于65个家族,其中比例最大的是bHLH和MYB家族;3 274条Unigene注释到植物抗性基因数据库,分布于13个类别,相匹配基因数量最大的是RLP和TNL。MISA软件共检测到12 366个SSR位点,分布密度为1/2.75 kb,重复基元类型丰富,标记开发潜力大。本研究利用高通量测序获得丰富的顶芽转录组信息,可以为大花序桉分子辅助育种提供丰富的资源。  相似文献   

2.
白芨转录组特性分析   总被引:1,自引:0,他引:1  
白芨(Bletilla striata)具有较高的药用、经济和观赏价值,但是其基因组和转录组序列未知,严重影响了其的研究开发和利用。本研究采用His4000测序平台对白芨的全株进行了转录组测序分析,共获得原始数据6.8 G,有效数据6.7 G,243 410条Unigene,经过与NR、GO、KOG及KEGG等数据库进行比较分析后,83 541条Unigene被注释到NR数据库,50 178条Unigene被注释到GO数据库,10 007条Unigene在KOG数据库获得注释,43 637条Unigene在Swissprot数据库获得注释,15 321条被注释到KEGG代谢途径中,2 021条Unigene参与了糖类代谢,1 309条Unigene参与了氨基酸合成和代谢,120条Unigene参与了萜类合成,106条转录因子与代谢相关;微卫星位点有31 958个,其中单核苷酸最多,15 709个,占49.16%,其次为二核苷酸和三核苷酸,分别有9 145个和7 104个,占28.62%和22.23%。本研究为白芨的重要功能基因挖掘、遗传育种及其研究开发提供了参考和依据。  相似文献   

3.
为了进一步阐明广藿香中药用活性成分生物合成的分子机制,本研究以海南广藿香幼叶及成熟叶片为材料,采用BGISEQ-500高通量测序平台进行转录组测序,分别获得了63 751 826条和65 949 390条clean reads,平均读长为90 nt。De novo组装后将All-unigene分别注释到Nr、KOG、GO、KEGG、Swiss-Prot、Inter Pro数据库,对每个数据库注释的Unigene数目进行统计,共有162 509条Unigene有对应的功能信息,其中105 430条Unigene被注释到Nr数据库,显示与芝麻有69.87%的相似度;有83 369条Unigene被注释到KOG数据库,根据功能将其分为25类;有12 261条Unigene与GO数据库中的基因具有相似性,将其归为3大类中49个功能组;有79 053条Unigene被注释到KEGG的代谢通路中,分属于124类代谢通路,包括次生代谢物质生物合成、倍半萜和三萜类化合物生物合成、黄酮和黄酮醇生物合成、花青素生物合成等。该研究结果对广藿香药用活性成分生物合成与代谢、关键酶基因克隆以及分子标记开发等研究有一定的帮助。  相似文献   

4.
为了深入了解文冠果转录组的整体水平及脂肪酸合成与代谢相关功能基因的表达情况,本研究以文冠果根、茎、叶、花为材料利用Pacific Biosciences RS II平台测序技术进行测序及生物信息学相关分析。平台共获得原始数据7.64 Gb,生成110 584个转录本,平均长度为1.9 kb。对所有转录本在NR、SwissProt、KEGG、KOG、GO、NT、pfam数据库进行注释和功能分类,结果共得到102 118个注释基因,占比92.34%。共有351个参与脂肪酸生物合成和120个参与脂肪酸延长的Unigene,分别编码15个脂肪酸生物合成和7个脂肪酸延长的关键酶。同时在110 584条Unigene中分析发现了94 906个SSR位点,单核苷酸重复频率最高(68.29%),并预测了6 059个转录因子(TFs)。与第二代测序(Roche 454 de novo)结果相比,PacBio平台所得到的转录本更长,转录本注释率也得到提高。本研究为文冠果的下一步分子生物学研究提供了较为可靠的转录组数据。  相似文献   

5.
为了获得罗布麻转录组信息,研究罗布麻中功能基因的表达以及分子标记的开发,本研究采用Illumina HiSeq2000高通量测序技术对罗布麻进行转录组测序及分析。通过过滤掉低质量的读序,共获得26148138个高质量的读序,组装得到61538个Unigene序列。其中,有25296个Unigene在公共数据库中得到注释。通过KEGG分析,共发现29个Unigene参与活性成分(黄酮类)生物合成。检测出单核苷酸至六核苷酸重复类型的SSR位点13524个。本研究结果分析了参与黄酮类化合物合成的相关基因以及潜在的SSR位点,为进一步研究罗布麻次生代谢产物合成的功能基因的挖掘、分子标记的开发以及资源利用提供有用的信息。  相似文献   

6.
采用Illumina测序技术对在醋酸钙、硫酸铵和蔗糖处理后蓝莓不同发育阶段的果实进行转录组测序,获得Clean Reads 2723731442条,经组装得到平均长度为753.65 nt的87608条Unigene。将转录组Unigene进行基因功能注释,其中39867条Unigene能被NR数据库注释,与葡萄同源序列最多,占8.58%;与GO数据库比对发现,有29661条Unigene获得注释,分别匹配到生物过程、细胞组成和分子功能三大类共59个分支;与KOG数据库进行比对,发现有21992条Unigene具有功能信息,分别涉及25类;根据KEGG数据库的注释信息进行Pathway注释,参与的代谢通路共有246条;共检测到8704个SSR位点,其中双碱基重复的SSR占78.57%。本研究为探索外源物质调控蓝莓果实生长发育、生理代谢的分子机理提供了理论基础。  相似文献   

7.
为揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,本研究以盐胁迫处理的露地菊及其对照为材料,使用Illumina Hiseq2500高通量测序平台对转录组进行测序,分别获得了60370448和71415448条Clean reads,通过序列拼接组装得到45591条Unigene,平均长度724 bp。有37675条Unigene在七大数据库(COG,GO,KEGG,KOG,Pfam,Swiss-Prot,NR)中得到注释。通过比对露地菊盐胁迫处理组和对照组样品间Unigene的表达量及在各数据库中的注释情况,统计得到:有4143条差异表达基因获得注释;有2441条差异表达基因在GO数据库中获得功能注释;注释到COG数据库中的2281条差异表达基因依据功能可分为25类;有1062条差异基因映射到KEGGPathway数据库中,涉及了199个代谢通路,包括核糖体途径、植物激素信号传导途径、淀粉蔗糖代谢、碳代谢、氨基酸的生物合成等。本研究获得的转录组数据将有助于揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,及相关抗性基因的挖掘和分子辅助育种等方面的研究。  相似文献   

8.
以南酸枣雌株叶片和成熟果实为材料,利用Illumina Hi Seq TM 4 000测序平台对其转录组进行测序,共获得14.15 G有效数据,通过序列拼接组装得到46 936条Unigene,平均长度为1 287 bp。36 299条Unigene(77.33%)在7大数据库(NR,NT,KO,Swiss-Prot,PFAM,GO和KOG)中得到注释,其中与GO数据库比对上的26 014条Unigene可分为生物过程、细胞组分和分子功能3大类53分支,注释到KOG数据库中的8 459条Unigene依据功能可分为25类。与KEGG数据库比对,6 225条Unigene分属5大类246条代谢通路中。南酸枣叶片和果实转录组中共发现5 631个差异表达基因,包括1 930个上调基因和3 701个下调基因。本研究获得的转录组数据将有助于开展南酸枣功能基因挖掘与利用、分子辅助育种和其种质资源遗传改良等方面的研究。  相似文献   

9.
大花序桉(Eucalyptus cloeziana)是中国重要用材林树种,但目前对其生物信息学研究缓慢,在一定程度上限制了大花序桉分子育种以及品种改良。采用Illumina Hi Seq TM 2000高通量测序平台对1年生大花序桉根系转录组测序和de novo组装,将得到的Unigene与公共数据库比对,同时进行转录组分析。结果显示,组装获得53 433条Unigene,其平均长度890 bp,N50长度为1 587 bp;有34 700条Unigene获得注释信息,占全部Unigene的64.94%,其中19 327条Unigene注释到KOG数据库,被分到25个类别中,共得到32 302个KOG功能注释信息;有11 197条Unigene注释到GO数据库中,共获得了54 971个GO注释功能,归于细胞组分、分子功能和生物学过程三大类;有12 181条Unigene得到KEGG注释,其中6 493条Unigene归入128条代谢途径,发现有57条Unigene参与氮代谢途径。通过软件查找获得13 290个SSR位点,二核苷酸重复类型占的频率最高,其次是三核苷酸、四核苷酸和六核苷酸,五核苷酸重复频率最低。本研究首次对大花序桉转录组进行分析,为深入开展大花序桉分子生物学研究提供基础数据来源。  相似文献   

10.
[目的]获得白羊草(Bothriochloa ischaemum)转录组数据库和差异表达基因。[方法]选取对照组和干旱胁迫组作为受试材料,采用Illumina HiSeq 4000进行转录组测序,并进行系统的生物信息学分析。[结果]共获得25.23 Gb数据(118580条Unigenes)。将所得到的Unigenes与基因库数据进行比较,对Unigenes进行功能注释,共50070条Unigenes获得功能注释。白羊草转录组中的Unigene根据GO功能大致可分为细胞组分、分子功能和生物学过程三大类共54个分支。将Unigene与KOG数据库进行比对,根据其功能大致可分为25类。KEGG数据库作为参考,依据代谢途径可将Unigene定位到116个代谢途径分支。通过差异性分析发现,差异性表达基因共3987条,其中上调基因占39.45%,下调基因占60.55%,相差较大。[结论]本研究首次对白羊草转录组进行了分析,为白羊草分子生物学研究提供了宝贵的基因组数据库资源。  相似文献   

11.
本研究利用Illumina高通量测序技术对PP333处理的朱顶红进行了RNA-seq测序,共获得26.91 Gb的数据,对其进行过滤去冗余后得到Unigene 106 684个,总长度为92 002 803 bp,平均长度为862 bp,N50为1 494 bp,GC含量为42.47%,Q20均达98%以上,表明测序质量较好。根据七大功能数据库比对结果,分别有53 853 (NR:50.48%)、29 732 (NT:27.87%)、35 889 (SwissProt:33.64%)、42 221 (KOG:39.58%)、40 258(KEGG:37.74%)、12 186 (GO:11.42%)以及42 559 (InterPro:39.89%)个Unigene获得功能注释。根据Nr注释结果,可匹配到物种为油棕、海枣、小果野芭蕉、莲等。在KOG注释中通用功能和预测占比最高。按GO功能分类,可分为生物过程、细胞组成、分子功能三类,52个分支,大量Unigene与代谢过程、细胞过程及单生物过程相关。按照KEGG功能分类,分为6类,21个功能组,大量Unigene与代谢相关,占比60.39%。本研究结果为朱顶红的矮化机理研究及其基因挖掘提供依据。  相似文献   

12.
本研究旨在揭示细叶百合在盐碱逆境中的基因表达表达情况,为合理利用盐碱地和大面积种植百合提供理论基础。以一年生的细叶百合鳞茎为材料,经过20 mmol/L NaHCO3处理24 h后,用Illumina HiSeqTM2000测序平台进行转录组测序。共测得56828个mRNA的注释信息,其中,55433个Unigene被注释到Nr数据库,26973条Unigene被注释到KOG数据库,23610条Unigene被注释到GO数据库,13142条Unigene被注释到KEGG数据库的五大类中。共鉴定出390个差异表达基因。选取了9个与盐碱胁迫密切相关的基因进行qPCR验证,9个基因的表达结果与转录组的结果基本趋于一致。通过细叶百合在碳酸盐(NaHCO3)逆境下的转录组对比数据,提供了许多的基因表达通路和表达量的差异,为合理利用盐碱地和大面积种植百合提供理论基础。  相似文献   

13.
亚麻的不同器官具有多种商业价值。随着土壤重金属污染情况日益加剧,有必要对亚麻响应重金属污染的分子机理进行研究。本研究采用二代测序技术,对亚麻在铅胁迫下地上部位样品进行转录组分析。通过对原始测序数据进行质量控制,并利用HISAT软件等对处理后数据拼接到亚麻参考基因组,获得了高质量Unigenes和拼接结果。对Unigenes进行序列比对、功能注释和分类、序列变异分析。结果显示,本次测序结果共获得43471条Unigene,并且这些Unigenes的大部分(89.6%)都完全比对到参考基因组的预测外显子区域。对测序结果的KOG和KEGG分析结果表明亚麻在铅胁迫条件下可能影响的通路信息。最后,对测序结果进行转录因子预测和序列变异分析,为后续针对亚麻响应重金属胁迫的相关研究提供了候选分子资源。  相似文献   

14.
为了研究高温胁迫下金线莲转录组表达特征,分析其热激响应机制。以正常培养和高温胁迫(45oC)的金线莲(NYJ2)为材料,利用Illumina HiSeqTM2000平台进行测序,通过Trinity软件进行De novo组装。结果共获得75688个unigene,有28323个unigene在Nr、KOG、KEGG和Swisspro数据库中得到功能注释,注释率为37.42%。其中,17532个unigene在KOG数据库中可归类到25个功能家族;10108个unigene被KEGG数据库注释到128个代谢途径中;17485个unigene被GO数据库的生物过程、分子功能和细胞组成三大功能注释到47个条目中。777个unigene在高温胁迫前后差异表达显著,其中胁迫后上调表达为362个,下调表达为415个,获得响应热胁迫的基因24个,包括热激蛋白的基因1个,PSⅠ和PSⅡ相关的基因15个、叶绿体rbcL基因3个、PLD基因2个,CAT编码基因、GAPDH基因、CYP编码基因各1个。本研究从转录组水平分析了金线莲对热胁迫的响应,这些数据将为功能基因的鉴定奠定基础,为培育耐高温金线莲品系提供了参考依据。  相似文献   

15.
山东栒子是中国山东省的特有种,现已处于极度濒危状态。目前,山东栒子的分子生物学研究较少,基因数据库资源极度缺乏,急需探究其生物学遗传信息,以加快对山东栒子的保护遗传学工作。本研究以山东栒子叶片、花、成熟果实为实验材料,利用PacBio Sequel测序平台对其转录组进行全长转录组测序。共得到高质量去冗余的转录本53932个,作为最终转录本序列。预测到的CDS区共52490个;对其SSR位点进行分析,对测序得到Unigenes进行单核苷酸至六核苷酸重复的SSR位点搜索,共搜索到26796个SSR位点。对非冗余转录本利用BLAST软件与NR、Swissprot、GO、COG、KOG、KEGG 6个数据库进行比对,一共成功注释了53319个Unigenes,其中与NR数据库进行比对中注释为苹果的的相关基因数量最多,其次是白梨和桃;在GO数据库中有33305条山东栒子Unigenes被注释分类,由生物学过程、细胞成分和分子功能三部分组成;在与COG数据库比对中,共有23910条比对到了同源序列,且一共被分为25类;在与KEGG数据库的一系列比对中,可将Unigenes映射到126条代谢通路中。本研究在高通量全长转录组水平对山东栒子进行了系统研究,这为进一步开展山东栒子的分子标记开发和挖掘优良基因提供了科学依据,从而推动山东栒子的保护与利用。  相似文献   

16.
为了研究牡丹、芍药远缘杂交胚败育的分子机理,本研究使用BGISEQ-500平台对牡丹、芍药杂交种胚转录组进行测序,通过测序,共得到了92.02 Gb数据。通过拼接组装去冗余后得到了86 195个Unigene,平均长度为1 189 bp。86 195个Unigene在七大功能数据库中进行注释,最终分别有49 172 (NR:57.05%)、38 352(NT:44.49%)、36 477 (Swiss Prot:42.32%)、38 905 (KOG:45.14%)、37 993 (KEGG:44.08%)、26 832 (GO:31.13%)以及37 758 (Pfam:43.81%)个Unigene获得功能注释。同时还检测出21 998个SSR分布于17 567个Unigene中,其中二核苷酸和三核苷酸这两种重复类型分别有5 628个和2 906个。在17 567个Unigene中预测出1 671个编码转录因子。不同发育时期的胚转录组数据中共筛选出13 974个差异表达基因,其中上调基因有8 647个,下调基因有5 327个。该转录组测序分析为寻找牡丹、芍药远缘杂交胚败育相关基因提供了一定的理论参考。  相似文献   

17.
为获得杭白芷转录组信息特征,本研究利用Illumina HiSeqⅩTen测序平台对杭白芷根进行高通量转录组测序,获得高质量序列(Clean reads)47742445条,Trinity denovo组装后得到47044条Unigenes,平均长度1164.20 nt。BLAST分析显示分别有32208(68.46%)、23049(48.99%)、10479(22.27%)、17883(38.01%)、28201(59.95%)、20731(44.07%)、55(0.12%)条Unigenes在数据库NR、Swiss-Prot、KEGG、KOG、eggNOG、GO、Pfam中获得注释,可归为GO分类的生物过程、细胞组分和分子功能3大类57分支,涉及205个KEGG代谢通路,其中包括27个次生代谢通路。蛋白编码框序列32303个,高等植物转录因子58个家族,借助MISA软件发现10020个SSR,其中二碱基重复最丰富,有4336个,出现频率为43.27%;五碱基重复SSR最少仅占0.37%。本研究获得了大量基因序列信息以及SSR信息,为今后开展相关分子机制研究提供了数据资源和理论基础。  相似文献   

18.
从组学水平分析盐胁迫下柳树内在分子机制,为柳树耐盐研究及耐盐基因的挖掘利用提供理论依据。本研究通过转录组测序技术对‘盐柳1号’(Salix psammophila’Yanliu No.1’)和‘渤海柳1号’(Salix matsudana’Bohailiu No.1’)经150 mmol/L NaCl胁迫处理后的叶片和正常叶片(对照)进行高通量转录组测序,并对获得的unigene进行从头组装和注释分析。结果表明:转录组测序共获得183987条Unigenes,平均长度为1080.18 bp,分别有120130条、140813条、98066条、88425条、47982条、83732条Unigenes被注释到NT、NR、COG、SwissProt、KEGG、COG和GO数据库,共有149864条(81.45%)Unigenes得到注释。在GO功能注释中,共得到55个GO功能小类,在KEGG代谢通路分析时,获得了135条KEGG通路。该转录组测序数据质量高,结果覆盖面广,为柳树耐盐基因挖掘和研究提供了一定的理论参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号