首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本研究基于RNA-Seq技术建立了一个由3个甘蔗原始亲本和8个不同来源的甘蔗栽培品种/系构成的甘蔗参考转录组,并进行生物信息学相关分析。研究结果表明:对供试材料+1叶RNA混合样本进行转录组测序,可组装出98 945条Contig,从中找到5 806个SSR位点,其中三核苷酸重复最多、六核苷酸重复最少,CCG/CGG出现的频率最高。进一步处理Contig获得75 656条Unigene,将所有的Unigene与Nr数据库、Swiss-Prot数据库、KEGG数据库和COG数据库进行Blast,有53 951条Unigene得到注释。在Nr和KEGG注释结果基础上,对Unigene进行GO和KEGG功能分类,分别获得44个功能小组和123个Pathway注释。研究结果可为研究甘蔗在不同时空条件下的差异基因表达奠定基础。  相似文献   

2.
为了进一步阐明广藿香中药用活性成分生物合成的分子机制,本研究以海南广藿香幼叶及成熟叶片为材料,采用BGISEQ-500高通量测序平台进行转录组测序,分别获得了63 751 826条和65 949 390条clean reads,平均读长为90 nt。De novo组装后将All-unigene分别注释到Nr、KOG、GO、KEGG、Swiss-Prot、Inter Pro数据库,对每个数据库注释的Unigene数目进行统计,共有162 509条Unigene有对应的功能信息,其中105 430条Unigene被注释到Nr数据库,显示与芝麻有69.87%的相似度;有83 369条Unigene被注释到KOG数据库,根据功能将其分为25类;有12 261条Unigene与GO数据库中的基因具有相似性,将其归为3大类中49个功能组;有79 053条Unigene被注释到KEGG的代谢通路中,分属于124类代谢通路,包括次生代谢物质生物合成、倍半萜和三萜类化合物生物合成、黄酮和黄酮醇生物合成、花青素生物合成等。该研究结果对广藿香药用活性成分生物合成与代谢、关键酶基因克隆以及分子标记开发等研究有一定的帮助。  相似文献   

3.
采用Illumina测序技术对在醋酸钙、硫酸铵和蔗糖处理后蓝莓不同发育阶段的果实进行转录组测序,获得Clean Reads 2723731442条,经组装得到平均长度为753.65 nt的87608条Unigene。将转录组Unigene进行基因功能注释,其中39867条Unigene能被NR数据库注释,与葡萄同源序列最多,占8.58%;与GO数据库比对发现,有29661条Unigene获得注释,分别匹配到生物过程、细胞组成和分子功能三大类共59个分支;与KOG数据库进行比对,发现有21992条Unigene具有功能信息,分别涉及25类;根据KEGG数据库的注释信息进行Pathway注释,参与的代谢通路共有246条;共检测到8704个SSR位点,其中双碱基重复的SSR占78.57%。本研究为探索外源物质调控蓝莓果实生长发育、生理代谢的分子机理提供了理论基础。  相似文献   

4.
本研究利用Illumina HiSeq~(TM)2000对马蓝转录组进行高通量测序,使用软件MicroSAtellite (MISA)分析转录组中的SSR位点信息。通过组装马蓝转录组数据获得了51 381条Unigene,并对获得的Unigene进行SSR检测,共检测到8 471个SSR位点,其分布在6 782条Unigene中,出现的频率为16.49%。SSR中以二核苷酸和三核苷酸重复类型为主,其中二核苷酸以重复单元AT/TA为主,占18.14%,其余类型的重复单元相对较少。SSR所在序列功能注释结果显示在Nr和SwissProt中分别有5 932和4 285条序列被注释,同时SSR所在序列还被注释到47个GO分类,25个KOG分类和29个KEGG代谢通路中。通过设计、筛选,共获得5 819对引物组合,随机挑选的18对引物中有13对引物扩增出符合预期大小的条带。马蓝SSR出现的频率高,重复种类丰富,为研究马蓝遗传多样性、基因定位和品质改良等提供了科学依据。  相似文献   

5.
本研究以石牌广藿香幼苗期茎和叶为样本,对转录组测序之后,共得到66 133 450条和65 148 526条reads序列。然后使用De novo拼接后把Unigene对比到各个数据库,经过对Unigene的统计分析,在有类似功能基因的92 974条Unigene中,有65 467条Unigene可注释到Nr数据库;有71 330条的Unigene可对比到KOG数据库,依据其功能信息将这些基因分成25类;有86 716条Unigene被发现与GO数据库中的基因具有相似性并将它们分为生物过程、细胞成分和分子功能3个大类共54个小类;以KEGG作为数据库参考比对到66 055条Unigene,并根据代谢通路将转录组数据分为137类,包括内质网蛋白处理、甘油磷脂代谢、精氨酸和脯氨酸代谢、硫辛酸的代谢等。本研究将为广藿香的活性物质的生物合成与代谢、功能基因的发掘、分子标记的开发应用等研究提供依据。  相似文献   

6.
7.
本研究利用Illumina HiseqTM4000测序平台对柚木(Tectona grandis L. F.)边材组织进行转录组测序,获得39.65 Gb的数据。拼接组装共得到90 843个Unigene,平均长度、N50以及GC含量分别为1 415 bp,2 208 bp和41.28%。将获得的Unigene与七大功能数据库进行比对,分别有64 416 (NR:70.91%)、69 281 (NT:76.26%)、28 777 (COG:31.68%)、18 630 (GO:20.51%)、49 594 (KEGG:54.59%)、44 707 (Swissprot:49.21%)以及50 938 (Interpro:56.07%)个Unigene获得功能注释。经过GO数据库的比对分析,18 630个Unigene被注释到生物过程、细胞组分和分子功能3大类别55个亚类。与COG数据库进行比对分析,28 777个注释Unigene按功能被划分为25类。基于KEGG数据库,44 595个Unigene序列注释到6大类,21个亚类代谢通路中。根据注释结果预测出2 772个编码转录因子的Unigene,检测出26 773个SSR位点,以及39 856个SNP位点。本研究为柚木分子育种工作的开展提供数据和参考。  相似文献   

8.
为探究响应向日葵干旱胁迫的转录组SNP标记信息,以向日葵抗旱自交系17062为供试材料,利用RNA-seq技术结合生物信息学分析方法,对SNP标记进行统计分析。结果表明,SNP类型分析中,转换率占62.82%,颠换率占37.17%,转换中以C/T发生频率最高,为31.51%。功能原件分布中,分布在外显子区的SNP数量为178744.3个,显著多于其他功能元件。对SNP位点序列注释发现,有76678条SNP基因具有GO注释,4379条具有KEGG注释。筛选GO注释排序前30位(Top30)差异基因(DEGs)中重复存在的SNP基因序列,得到1542条,其中650条基因序列有GO注释。这些差异基因涉及到了多个生物功能与重要代谢途径,对向日葵转录组SNP标记开发、向日葵抗旱种质资源鉴定及抗旱“三系”杂交种选育具有重要意义。  相似文献   

9.
云南火焰兰(Renanthera imschootiana Rolfe)是濒临灭绝的附生植物,关于其分子水平的研究少有报道。为了获得云南火焰兰相关基因组基础信息,本研究通过Illumina HiSeqTM4000技术对云南火焰兰叶片进行转录组测序,并利用相关生物信息学数据库对其进行序列比对和数据分析。分析结果表明:共获得77 888条功能基因(Unigenes),其N50为1 348 bp,平均长度为805 bp,Q20和Q30序列分别占98.04%和94.32%。经比对,在Nr、KEGG、KOG、Swiss-prot、GO等数据库中能得到注释的Unigene分别为31 298、29 356、14 852、15 697、17 645条。在GO数据库中,共得到24 473个GO功能,将其分为3个大类和47个亚类,以生物过程这一类别所注释的基因数最多;KOG功能注释信息有17 743个,将其分为25个基因功能大类,其中基因数目较多的分别是一般功能基因和信号传导机制的相关基因;在KEGG中涉及的相关通路可将其归为19个亚类,其中以代谢通路较为突出。此外,对云南火焰兰转录组Unigene进行CDS比对和预测,共预测到2 317条CDS,其大小主要集中在200~500 bp,占总CDS的79.41%。本研究可为云南火焰兰乃至火焰兰属植物功能基因的挖掘、利用以及遗传育种等方面的工作提供一定的科学依据。  相似文献   

10.
为了解荔枝叶片白化变异体遗传特点,本研究以白化变异体比例较高的‘玉谭蜜荔’白化变异体苗与正常苗为试验材料,测定叶片叶绿素含量,并观测叶绿体结构差异,最后通过高通量测序技术对苗期叶片进行转录组测序分析。结果表明:‘玉谭蜜荔’种子实生苗中白化变异体的比例约为8.59%;白化苗叶片色素含量极低,仅为正常苗的0.519%;叶绿体的结构松散,基粒片层结构较少或缺失。对高通量测序数据进行组装和注释,共获得Unigene 42 782条,平均长度987 bp,比对到Nr、KOG、KEGG、Swiss-prot四大数据库中,超过64%的Unigene序列获得注释,差异分析表明在细胞色素合成、光系统亚基合成蛋白、采光复合物a/b结合蛋白相关序列表达显著下调。本研究为该变异体的基因定位鉴定提供了一定的遗传基因注释信息。  相似文献   

11.
铁筷子是毛茛科植物,既是重要中药材,也是新兴的高档宿根花卉。本研究以中国原产铁筷子幼嫩叶片为试材,采用二代测序技术对材料进行转录组测序,通过对原始数据进行质量控制,并用Trinity软件等对处理后数据进行拼接,获得了高质量转录本和Unigenes。对Unigenes进行序列比对、功能注释和分类、基因编码区预测及单核苷酸多肽标记(SSR)分析,结果显示,本次测序共获得转录本94 067条,代表的Unigene共有70 119条;Unigenes在非冗余蛋白数据库(Nr)比对,E值得分最高的物种中,睡莲占比最高;Unigenes在GO分类中注释到46个次级功能条目,在KOG功能分类中"翻译后修饰,蛋白开关和分子伴侣"功能注释到的基因最多;通过Nr数据库和软件分析,共有58 403个基因编码区被预测到;同时软件分析共获得SSR分子标记9 057条。本研究较早地为铁筷子的分子研究提供了转录组数据,相关研究结果对促进今后铁筷子基因发掘、分子标记育种等工作将产生积极意义。  相似文献   

12.
百合未授粉成熟雌蕊转录组测序研究   总被引:1,自引:1,他引:0  
本研究旨在大量发掘百合雌蕊特异表达基因,为研究百合杂交障碍的分子机制提供依据。利用Illumina高通量测序平台,进行百合未授粉成熟雌蕊转录组测序和数据组装,并对获得的Unigene进行功能注释、分类和代谢通路分析。“干柱头”雌蕊LoP1和“湿柱头”雌蕊LoP2分别获得40792条和39708条Unigene。2个样品的Unigene通过序列拼接,去冗余处理,以及同源转录本聚类,得到44175条All-Unigene。基于NR、NT、Swiss-Prot、GO、KEGG和COG等6个数据库进行相似性比对(E值≤10-5),依次分别有30343、21647、21281、19274、12964和22227个基因被注释。KEGG分析中,19274条AllUnigene被注释到128个代谢通路上。基因分析显示,百合未授粉成熟雌蕊已为授粉受精做好了物质、能量、信号转导以及抗病原等准备工作。  相似文献   

13.
本研究旨在揭示细叶百合在盐碱逆境中的基因表达表达情况,为合理利用盐碱地和大面积种植百合提供理论基础。以一年生的细叶百合鳞茎为材料,经过20 mmol/L NaHCO3处理24 h后,用Illumina HiSeqTM2000测序平台进行转录组测序。共测得56828个mRNA的注释信息,其中,55433个Unigene被注释到Nr数据库,26973条Unigene被注释到KOG数据库,23610条Unigene被注释到GO数据库,13142条Unigene被注释到KEGG数据库的五大类中。共鉴定出390个差异表达基因。选取了9个与盐碱胁迫密切相关的基因进行qPCR验证,9个基因的表达结果与转录组的结果基本趋于一致。通过细叶百合在碳酸盐(NaHCO3)逆境下的转录组对比数据,提供了许多的基因表达通路和表达量的差异,为合理利用盐碱地和大面积种植百合提供理论基础。  相似文献   

14.
《分子植物育种》2021,19(14):4610-4617
本研究基于新一代高通量测序技术平台Illumina Hi SeqTM4000对野百合进行转录组测序,对物种的转录组序列进行统计,并将得到的数据进行de novo组装,结果共获得47 605条Unigenes,总长度为33 972 306 bp,平均长度为713 bp,N50为1 204 bp。将获得的Unigenes与Nr、Swiss-Prot、KEGG以及KOG数据库进行比对,结果显示,分别有28 104、17 739、11 984及14 682条Unigenes成功注释。通过与KOG数据库进行比对,可分为25个不同的功能注释。与GO数据库进行比对,结果显示,共有33 254条Unigene获得注释,这些功能注释分为三大类50个功能亚类。其中,生物过程最多。以KEGG数据库参考,共有11 984条Unigenes参与133条代谢途径分支,以代谢相关的通路较为集中,找到了与花青素合成关键酶的Unigenes。本研究极大地丰富了野百合的基因资源,为进一步开展野百合功能基因及分子标记育种等方面的研究提供了一定理论支持与依据。  相似文献   

15.
基于高通量测序的铁皮石斛叶片转录组分析   总被引:1,自引:0,他引:1  
采用新一代高通量测序技术Illumina Hi Seq 2000对铁皮石斛(Dendrobium officinale)转录组进行测序,共获得11 153 295 000 nt数据。对测序获得数据(reads)进行序列拼接组装,共获得121 596个单基因簇,序列平均长度为660 bp,整体序列信息达到了40.16 Mb。再应用生物信息学相关数据库进行比对,结果表明,本测定获得的52 345个Unigene能够在数据库中检索到相关功能注释。通过GO数据库比对,测序获得Unigene功能分类可分为3大类57个分支,其中有大量的Unigene与细胞、催化活性、细胞部分、细胞器等相关功能。通过COG数据库比对,测序获得Unigene功能注释到25类直系同源蛋白分类中如转录、复制,重组和修复、翻译,核糖体结构和生物起源等。以KEGG数据库作为参考,依测序获得Unigene可定位到128个代谢途径分支,如脂类代谢、氨基酸代谢、碳水化合物代谢等。进一步利用软件查找SSR位点发现,从Unigene中共找到9 892个SSR位点。SSR不同重复基序类型中,出现频率最高的为AG/CT,其次是AAG/CTT、CCG/CGG和AGG/CCT。  相似文献   

16.
为了丰富紫花槭转录组数据,进一步开展紫花槭秋季叶片呈色机制研究.本研究以紫花槭秋季转色期三个阶段(前期,中期,后期)叶片为材料,采用高通量测序技术进行转录组初步分析.转录组数据共获得50501条Unigene,有35316条Unigene在数据库中得到注释,其中NR数据库中注释到的Unigene数量最多,共35024条,占69.4%.在注释到的物种中,紫花槭比对的Unigene与甜橙(Citrus sinensis)相似度最高,共有4290条,占12.25%.紫花槭转录组中的Unigene根据GO功能可分为生物学过程、细胞组分和分子功能3大类,共有25375条,其中生物学过程的基因最多,主要聚集于代谢过程和细胞过程等.基于Unigene库的基因结构分析,其中SSR分析共获得12711个SSR标记,占Unigene总数的36%.SSR位点共包含150种重复基元,单碱基重复所占比例最高(7184个,61.86%),四碱基重复、五碱基重复和六碱基重复所占比例较低.Unigene库中共有328239个SNP位点,发生频率为1/190 bp,SNP位点分为转换和颠换两种类型的碱基替换方式,其中碱基转换位点213787个(65.13%),碱基颠换位点114452个(34.87%),碱基转换类型发生频率高于颠换类型.6种单碱基变异中,2种转换类型A/G、C/T的发生频率分别为33.03%和32.10%;4种颠换类型中A/T发生频率最高,为11.52%;C/G发生频率最低,为5.79%.紫花槭转录组秋季叶色表达的转录组分析,可为紫花槭叶色基因调控、定向分子育种和培育彩叶新品种提供研究提供基础的数据信息.  相似文献   

17.
为了开发马尾松SSR标记,本研究利用MISA软件对马尾松转录组测序获得的148 186条Unigene (序列总长约91 449.7 kb)进行全面分析,共搜索获得6 611个SSR位点,分布在6 003条Unigene上,SSR发生频率为4.05%,平均每13.83 kb出现1个SSR,结果发现单核苷酸重复出现的频率占总SSR的53.60%;二核苷酸为23.46%;三核苷酸为21.33%。通过对含SSR的Unigene的GO分析,显示生物过程包含的Unigene占40.60%;细胞组分包含的Unigene占35.45%,分子功能包含的Unigene占23.95%;转录组中有724个Unigene可被注释到110个KEGG通路中,其中被注释到新陈代谢的Unigene最多有312个,其次是遗传信息处理类有183个。根据含SSR的Unigene序列共设计了4 247对SSR引物,并随机挑选30对SSR引物进行PCR扩增验证,其中12对引物能够扩增出目标条带,引物的有效性为40%。本研究结果表明,马尾松转录组测序获得的Unigene序列可作为SSR标记开发的有效来源,所开发的SSR标记为马尾松的遗传图谱构建、分子标记辅助育种等研究提供丰富可靠的标记。  相似文献   

18.
《分子植物育种》2021,19(16):5342-5351
为了获得珍贵用材树种大花序桉顶芽转录组数据及预测关键基因功能,本研究基于Illumina HiSeq X Ten测序技术获得大花序桉顶芽转录组原始数据,经Trinity组装拼接获得高质量Unigene,并与NR、Swiss-Prot、GO、KOG、egg NOG和KEGG等生物信息数据库进行序列比对和功能注释,利用MISA软件进行SSR位点搜索和分析。从大花序桉顶芽中共获得26 587条高质量Unigene,平均长度为1 279.69 bp;共有22 099条Unigene至少在一个数据库中被成功注释,其中,11 507条Unigene被注释到KOG数据库中25个功能类别,以参与一般功能基因的数量最多;GO数据库中,所注释到的14 105条Unigene分别匹配到生物功能、细胞组分和分子功能3大类50个功能基因区,其中执行生物过程所占比例最多;KEGG功能注释共发现有7 117个Unigene参与127条代谢通路,以代谢相关的基因最丰富;共有1 021条Unigene注释到转录因子数据库,分布于65个家族,其中比例最大的是bHLH和MYB家族;3 274条Unigene注释到植物抗性基因数据库,分布于13个类别,相匹配基因数量最大的是RLP和TNL。MISA软件共检测到12 366个SSR位点,分布密度为1/2.75 kb,重复基元类型丰富,标记开发潜力大。本研究利用高通量测序获得丰富的顶芽转录组信息,可以为大花序桉分子辅助育种提供丰富的资源。  相似文献   

19.
台湾金线莲转录组特性研究   总被引:1,自引:0,他引:1  
台湾金线莲(Anoectochilus formosanus)是我国传统的珍贵药材,素有"金草"、"神药"等美称,具有很高的药用价值、观赏价值和经济价值。台湾金线莲的全草入药,且挥发油中也含有多种药用成份。本研究采用Illumina Hi Seq 2000高通量测序技术,对其全草进行转录组分析,共获得原始数据5.3 Gb,有效数据4.4 Gb,Unigene有173 513条,Unigene平均长度为680 bp;通过与其他核酸、蛋白质数据库的Blast比对,58 451条得到Nr功能注释,21 386条得到COG功能分析,45 812条GO功能解释。KEGG代谢途径研究发现,130条Unigene与黄酮类物质有关,114条Unigene与生物碱有关,441条Unigene与萜类物质有关。搜索发现21 195个微卫星位点,其中单核苷酸最多有13 126个,占61.93%,其次分别是三核苷酸和二核苷酸,分别占17.4%和15.61%。  相似文献   

20.
白芨转录组特性分析   总被引:1,自引:0,他引:1  
白芨(Bletilla striata)具有较高的药用、经济和观赏价值,但是其基因组和转录组序列未知,严重影响了其的研究开发和利用。本研究采用His4000测序平台对白芨的全株进行了转录组测序分析,共获得原始数据6.8 G,有效数据6.7 G,243 410条Unigene,经过与NR、GO、KOG及KEGG等数据库进行比较分析后,83 541条Unigene被注释到NR数据库,50 178条Unigene被注释到GO数据库,10 007条Unigene在KOG数据库获得注释,43 637条Unigene在Swissprot数据库获得注释,15 321条被注释到KEGG代谢途径中,2 021条Unigene参与了糖类代谢,1 309条Unigene参与了氨基酸合成和代谢,120条Unigene参与了萜类合成,106条转录因子与代谢相关;微卫星位点有31 958个,其中单核苷酸最多,15 709个,占49.16%,其次为二核苷酸和三核苷酸,分别有9 145个和7 104个,占28.62%和22.23%。本研究为白芨的重要功能基因挖掘、遗传育种及其研究开发提供了参考和依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号