首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 326 毫秒
1.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

2.
李青  何斌  陈群利  游萍 《江苏农业科学》2022,50(3):28-35+48
为进一步丰富鲫鱼基因组数据,对肝脏、血液和卵巢组织进行高通量转录组测序。采用Illumina Hiseq高通量测序平台进行转录组测序,对所获得序列进行比对、基因注释、差异表达和SNP、SSR分析。结果提示,组装得到127 801条unigene,平均长度为735 bp。与相应数据库比对,最终获得117 414(91.87%)个有注释信息的unigene,有105条unigene获得GO注释,并分类到生物学过程、细胞组分和分子功能三大类42个功能中;有20 725条unigene被归纳到KOG的26个直系同源功能类型;获得KEGG注释的unigene共参与五大类32小类代谢通路。在鲫鱼肝脏、血液和卵巢组织中分别检测到307 740、343 516、348 795个SNP位点,共检测到48 808个SSR位点。提示获得有注释信息的unigene共117 414条,此外,获得一些SNP和SSR位点。结果可为进一步克隆和挖掘鲫鱼功能基因、多态性检测及群体遗传多样性分析等方面研究奠定基础。  相似文献   

3.
【目的】对银耳进行转录组测序分析,分析多糖生物合成途径和挖掘关键功能基因。【方法】采用Illumina Hiseq 2500测序平台对银耳菌丝体进行测序,组装得到unigene序列,并与公共数据库进行对比分析和注释,挖掘果糖和甘露糖代谢通路相关基因。【结果】本研究共得到4.72 Gb raw data,拼接后获得17 008条unigene序列,N50为2073 bp;注释结果表明,76.47%序列能够注释到Uniprot公共数据库,注释到GO分类和KEGG通路的unigene分别为10 152和5671条。进一步分析银耳果糖和甘露糖代谢途径相关基因,挖掘得到74条unigene;其中编码L-iditol 2-dehydrogenase的unigene最多,其次是butanol dehydrogenase。【结论】基于转录组测序数据解析及预测,为研究银耳多糖和其它产物的生物合成途径及分子机制提供了数据支持,也为银耳品质的形成提供理论依据。  相似文献   

4.
利用毛葡萄叶片高通量转录组测序数据进行简单重复序列(simple sequence repeat,简称SSR)搜索并对其所在的序列进行注释,从而为毛葡萄分子标记开发提供有效信息。从35 238条质量较高的unigene中搜索到4 428个SSR位点,对这些序列进行基因本体(gene ontology,简称GO)、同源蛋白质簇(cluster of orthologous groups of proteins,简称COGs)和京都基因与基因组百科全书(Kyoto encyslopedia of genes and genomes,简称KEGG)分类,给出功能注释和Pathway注释,共注释了3 197条unigene。COG数据库将SSR序列分成25类,通过GO分类和KEGG富集性分析,将SSR序列分别归类于38个GO类别和103条通路。这些序列涉及了许多重要的生物功能和代谢途径,预示着这些潜在的标记可能与重要的生物功能有关,这些信息为毛葡萄分子标记的开发和应用奠定了基础。  相似文献   

5.
6.
为探讨辣木叶营养价值形成的遗传基础,采用RNA-seq对不同发育时期的辣木叶混合样品进行转录组测序,获得44 056 449个reads,共组装得到75 452条unigene,平均长度为795.69nt,其中有15 824条unigene长度大于1 000nt。采用公共数据库进行同源比对,共有30 847条unigene得到注释。其中,有18 277条unigenes被注释到GO数据库的52个功能组,9 689条unigene在COG数据库中得到注释。有10 130条unigene被富集到129条KEGG途径,包括碳代谢、氨基酸生物合成和氧化磷酸化途径。  相似文献   

7.
利用RNA-seq技术对所构建的野生毛葡萄(Vitis quinquangularis Rehd)叶片的转录组进行测定,对原始reads进行过滤和组装,得到了35 238条质量较高的unigene,平均长度为1 081 nt,N50为1 735 nt。基于NCBI蛋白质数据库(Nr)、蛋白质序列数据库(Swiss-Prot)、京都基因与基因组百科全书(KEGG)数据库和直系同源基因簇(COG)进行相似性比对,共注释了26 751条unigene,另有8 487条unigene未被注释。物种同源性显示与葡萄的同源性最高为74.48%。利用COG数据库将unigene分成25类,通过GO分类和KEGG富集性分析,将unigene分别归类于44个GO类别和122个代谢途径。此外,在35 238条unigene中共搜索到4 428个SSR位点,二核苷酸的SSR数目最多(1 906条),其次为三核苷酸(1 762条)。这些信息为毛葡萄功能基因、相关候选基因的发掘以及分子标记辅助育种提供了重要依据。  相似文献   

8.
对黑紫色叶紫薇品种‘赤红’叶片进行高通量测序,并利用Trinity(2.8.6)对测序数据进行从头组装,共获得23 791条unigene,其中91.86%的序列在NR、GO、COG、KEGG等5大数据库中得到注释;NR数据库比对到的unigene数量最多,占比91.93%,随后依次为SWISS(67.95%)、COG(60.43%)、GO(51.37%)和KEGG(35.43%)。在NR数据库中,‘赤红’紫薇所有的unigene仅比对到1个物种——石榴(Punica granatum L.),表明同属于千屈菜科的紫薇和石榴亲缘关系较近。从转录组中共筛选到4 775个SSR位点,包括6种核苷酸重复类型,其中A/T和AG/CT类型占比最高。对色素合成相关通路基因进行分析,共挖掘到18个与类黄酮和花青素相关的基因,其中花青素合成通路中的UGT79B1、BZ1、UGT75C1可能是‘赤红’紫薇形成紫黑色叶的关键基因。  相似文献   

9.
云锦杜鹃Rhododendron fortunei具有很高的园艺观赏价值。由于缺乏相关的遗传信息,云锦杜鹃的多样性、分子辅助育种等工作进展较为缓慢。通过高通量测序技术(Illumina),对云锦杜鹃的转录组进行了测定和分析。通过测序拼接和去冗余共获得84 633条单基因簇(unigene)序列,平均长度为691.4 bp。通过与公共数据库比对成功注释到了35 526条单基因簇,其中与葡萄Vitis vinifera基因相似的序列最多。根据基因本体论数据库(GO)可将23 215个单基因簇归类于生物学过程、细胞组分及分子功能等三大类的55个功能组;真核直系同源基因数据库(KOG)将11 085条单基因簇分为26个功能分类,涉及一般功能预测的单基因簇最多,多达1 970条;以京都基因与基金组百科全书(KEGG)作为参考,依据代谢途径可将9 887个单基因簇定位到272个代谢通路。进一步分析基因注释结果,挖掘获得24个编码MADS-box基因的单基因簇分属于10个不同亚家族。此外,检测到了21 900个简单序列重复(SSR)位点,可用于SSR标记开发。  相似文献   

10.
为获得岩原鲤转录组信息,发掘功能基因,本研究采用Illumina高通量测序技术对岩原鲤全组织转录组进行测序。结果获得64 257 918个EST序列,经拼接和组装得到83 252条单基因序列(unigene),平均长度787 bp,长度范围201~16 572 bp。利用NCBI的蛋白质非冗余数据库(Nr)对所有unigene进行相似性搜索,共有37 157条unigene(44.63%)与数据库中的已知序列同源。利用Blast2GO v2.5软件对unigene进行注释,共得到29 919条(35.93%)注释基因,根据GO功能分类将其分为生物过程、细胞组分和分子功能3大类56亚类。经KOG注释及分类,共有17 869条(21.49%)unigene成功注释到真核直系同源组中,并将其分为26个功能组分。经KEGG代谢通路分析可分为5大类(细胞过程、环境信息处理、遗传信息处理、代谢和有机系统)32小类共267个代谢通路。本研究通过高通量测序技术,对岩原鲤转录组进行测序,获得了大量的转录组信息,为岩原鲤功能基因克隆及基因组学研究提供了基础。  相似文献   

11.
【目的】开展荸荠球茎发育过程转录组测序研究,为研究荸荠球茎发育过程相关基因表达信息提供参考。【方法】运用高通量测序技术,对荸荠球茎不同发育时期进行转录组测序研究。【结果】组装共得到223 182条转录本和90 542条Unigene,平均长度为809 bp,N50为1119。组装完整性较高,效果较好。对所得Unigene进行不同数据库注释,共有50 583条Unigene成功注释到7个数据库(NR、GO、NT、Pfam、KEGG、KOG及Swiss-prot)。对差异表达基因分析,发现球茎膨大初期的差异表达基因数目最多,为最活跃阶段。GO功能富集分析结果表明,33 205个基因获得功能注释,分为分子功能、细胞组分和生物学过程等3大类和54个亚类。COG功能分类结果表明,17 743个基因分布于25个功能区域,其中碳水化合物代谢占重要地位。KEGG代谢通路注释结果表明有20 667个基因获得功能注释,共有116条代谢途径,其中淀粉-蔗糖代谢占主要作用。【结论】利用高通量转录组测序技术首次建立了荸荠优良品种‘桂蹄3号’球茎的转录组数据库,为进一步研究荸荠球茎淀粉生物合成相关基因的功能及形成的分子机制提供了数据基础。  相似文献   

12.
基于全长转录组测序(isoform sequencing, Iso-Seq)技术对野生马齿苋叶片(对照、干旱和低温胁迫3种处理的叶片)转录组进行测序及其转录组信息分析的结果显示,总共得到641 732条原始片段,质控后得到合格的插入片段26 758 071条,总碱基量为44 Gb,利用CCS软件获得442 760条一致性序列,根据smrtlink软件得到全长的插入片段和全长的去除嵌合体的插入片段分别为391 258条和301 412条,去除冗余得到103 298条转录本,最终得到39 717条unigene,预测出40 952条LncRNA和38 419条CDS序列;并将unigene与Uniprot、Pfam、GO、KEGG、eggNOG、Pathway和Nr等数据库进行同源比对,其中36 381条unigene被注释,从这些unigene里查找到25 898个简单重复序列标记(simple sequence repeats, SSR)位点。利用差异表达分析软件DESeq2筛选不同处理组间的差异表达基因,对照和干旱处理、对照和低温胁迫处理及干旱和低温胁迫处理间分别鉴定出16 194(...  相似文献   

13.
以广西梧州紫芽六堡茶为研究对象,运用MISA软件对转录组测序获得的165 570条unigene序列(总长度为240 177 233 bp),进行SSR位点搜索.使用Excel软件对SSR位点的出现频率、基元类型、基元组成、平均距离等进行处理分析.结果表明,共在10 058条unigene中找到符合条件的SSR位点11...  相似文献   

14.
【目的】获得冬瓜转录组序列、遗传变异等信息,从中挖掘冬瓜基因数据及SSR分子标记,为冬瓜后续研究提供数据支撑。【方法】以冬瓜嫩叶为材料,利用Illumina HiSeq~(TM)2000技术对冬瓜进行转录组测序,构建数据库从中获得干净序列。经De novo拼接组装后,将获得的单基因簇(Unigene)数据在非冗余蛋白数据库(nonredundant protein database,Nr)、蛋白质序列数据库(Swiss Prot protein database,Swiss Prot)、基因本体论数据库(gene ontology,GO)、蛋白质真核同源数据库(eukaryotic orthologous groups,KOG)、东京基因与基金组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)、蛋白质家族域数据库(protein families database,Pfam)6个公共数据库中进行比对,最终得到冬瓜单基因簇注释信息。利用MISA软件对转录组单基因簇进行搜索,获得单基因簇中的SSR位点。【结果】从冬瓜嫩叶中得到62 021 032条高品质序列,组装后获得40 611条单基因簇,平均长度955 bp。将所有单基因簇在Nr和Swiss Prot数据库中进行比对,结果分别比对到27 474及19 573条单基因簇;在GO数据库中,所注释到的10 659条单基因簇分别匹配到生物功能、分子功能和细胞组分3个本体的47个功能组中;与KOG数据库进行注释比对,根据其功能将注释到的单基因簇划分为25类;KEGG数据库比对注释到10 799条冬瓜的单基因簇,可分为5个大类、19个亚类、125条代谢途径;在Pfam数据库中比对到17 990条单基因簇,分属于369个类群。SSR位点搜索发现,有5 086条单基因簇包含SSR序列,获得5 474个SSR位点。【结论】利用高通量测序获得大量冬瓜转录组信息,有助于从分子水平对冬瓜进行深入研究。  相似文献   

15.
【目的】分析‘怀玉山’高山马铃薯Solanum tuberosum var. cormosus ‘Huaiyushan’叶绿体基因组特征及密码子使用偏好性,为开展‘怀玉山’高山马铃薯叶绿体基因组密码子优化、叶绿体基因组改造,探索物种进化和增加外源基因表达等研究提供参考依据和理论基础。【方法】采用高通量测序技术对‘怀玉山’高山马铃薯叶绿体基因组进行测序,并利用生物信息学分析软件对组装和注释后的叶绿体基因组进行结构、基因组成及密码子偏好性分析。【结果】‘怀玉山’高山马铃薯叶绿体基因组大小为155 296 bp,为经典的4段式结构。大单拷贝区(LSC)、小单拷贝区(SSC)和反向重复区(IR)长度分别为85 737、18 373、25 593 bp,总鸟嘌呤和胞嘧啶所占的比例(GC比例)为37.88%,共注释出133个基因,包含87个编码区(CDS)基因、37个tRNA基因、8个rRNA基因和1个假基因。‘怀玉山’高山马铃薯叶绿体基因组中共检测到38个简单重复序列位点(SSR位点,36个单碱基重复和2个双碱基重复)和32个长重复序列(16个正向重复和16个回文重复)。‘怀玉山’高山马铃薯叶绿...  相似文献   

16.
为研究绒山羊绒毛生长周期内皮肤基因表达规律以及皮肤差异表达基因的挖掘,采用Illumina HiSeqTM2000高通量转录组测序平台RNA-Seq技术,对3只成年雌性阿尔巴斯型内蒙古绒山羊全年12个月的皮肤样本进行转录组测序,将无参考基因组de novo拼接组装的unigene运用Nr,GO,COG以及KEGG数据库进行比对注释,并进行差异基因在全年各月份间的变化规律分析。结果显示,测序获得的unigene数为105 854条,比对注释基因55 541个,其中共有51 078条转录本进行了GO注释,21 189条转录本在COG数据库分析得到注释,26 201条预测基因KEGG数据库比对成功。其中皮肤基因GO注释在生物学功能分类中,细胞过程、代谢过程、生物学调控、生物功能调控以及刺激应答方面注释到的转录本比例最大;在分子功能分类中,结合以及催化活性作用方面注释到的转录本比例最大;通过COG数据库的比对注释,看到皮肤表达基因的同源蛋白功能主要集中在基因转录、翻译后修饰、和信号传导机制方面,反而在同工酶转运和代谢、细胞动力、二级代谢生物合成、转运和催化以及核结构方面注释到的基因极少;皮肤转录组数据与KEGG数据库比对,得到皮肤相关转录本较为富集的几条通路分别为MAPK signaling pathway,Wnt signaling pathway,Notch signaling pathway,Hedgehog signaling pathway,TGF-βsignaling pathway,JAK-STAT signaling pathway以及Focal signaling pathway;通过绒山羊不同月份皮肤转录组测序数据进行差异基因分析,得出绒山羊全年皮肤生长周期中基因差异变化规律为绒山羊全年皮肤共有4次较为剧烈的基因差异变化,第1次发生在2月与3月之间,第2次发生在3月与4月之间,第3次发生在6月与7月之间,第4次发生在10月与11月之间,前2次出现的基因差异变化较后2次剧烈得多,说明绒山羊绒毛生长启动时基因变化剧烈,而绒毛生长到休止时的皮肤基因变化较为缓和,是一个基因缓慢变化的过程。  相似文献   

17.
《山西农业科学》2016,(8):1065-1072
采用高通量测序技术对黄芩的转录组进行测序,获得了29 099 899条reads数据,拼接后得到53 353条Unigene;将所获得的Unigene与COG,GO,KEGG,Swiss-Prot,NR这5个公共数据库进行比对,结果发现,分别有10 756,21 950,8 101,20 339,29 288条Unigene可比对到以上5个数据库中;已注释的Unigene与COG数据库比对后按功能可分为25类;根据GO功能可分为三大类57个亚类;经过与KEGG数据库比对后按照代谢通路可分为116类;利用Get ORF软件进行ORF预测,获得长度大于300 nt的ORF共20 552个;通过SSR分析,共获得5 658个SSR标记。获得的转录组信息可为今后进行黄芩分子标记的开发和关键基因的克隆及功能分析等研究提供基础数据。  相似文献   

18.
[目的]筛选出可用于黄唇鱼(Bahaba flavolabiata)遗传资源评价及亲缘鉴定的SSR分子标记,为开展其保护遗传学研究打下基础.[方法]利用Illumina HiSeq 4000测序平台对野生黄唇鱼样本进行转录组测序,采用TGICL对转录组数据进行聚类去冗余以获得Unigene,并通过生物信息学方法进行功能注释分类、代谢通路和SSR特征分析等.[结果]黄唇鱼混合组织的转录组测序共获得13.43 Gb数据,经组装并去冗余后获得65047条Unigenes.采用BLAST对组装获得的Unigenes进行七大功能数据库(NR、NT、GO、COG、KEGG、Swissprot和Interpro)注释,结果共有55583条Unigenes被注释(占85.45%).通过MISA对黄唇鱼的Unigene进行SSR搜索,共检测到29797个SSR位点分布于19664条Unigenes中.SSR位点分布类型及其特征分析结果显示,最主要的重复类型为二核苷酸重复基元(11855个,占39.79%),其次是单核苷酸重复基元(9695个,占32.54%)和三核苷酸重复基元(6663个,22.36%),而四核苷酸、五核苷酸和六核苷酸重复基元的数量相对较少.二核苷酸重复基元类型中重复最多的基序是AC/GT(8355条),在三核苷酸重复基元类型中重复最多的基序是AGG/CCT(1866条).从随机选取的186对SSR引物中,最终筛选出47对扩增稳定性好且具有多态性的SSR引物,以二核苷酸和四核苷酸重复基元的扩增结果居多.[结论]通过转录组测序能有效筛选出具有多样性的黄唇鱼SSR分子标记,可为黄唇鱼的遗传多样性分析、亲缘鉴定和遗传图谱构建等后续研究提供基础资料.  相似文献   

19.
为获取入侵性检疫害虫椰子织蛾的基因信息,利用高通量测序技术对该害虫进行了转录组测序。结果表明:经拼接共获得了37 416条unigenes,平均长度为803 bp,N50为1 415 bp;通过BlastX比对,有19 154条unigenes (51.19%)成功在Nr中被注释。在Nr中成功注释的unigene,与黑脉金斑蝶同源性最高,达到68.45%;在GO注释中,共有14 131 (37.76%)条unigenes被成功注释到细胞组分、分子功能和生物过程3大类的54个分支;在COG数据库中,成功注释的8 606条unigenes被注释到26个分类;在KEGG中,共有6 171条(16.49%) unigenes被注释到5大类通路的260条途径上。基于构建的转录组数据库,鉴定得到3 248个微卫星。  相似文献   

20.
采用RNA-Seq技术,对黄连根茎与须根进行转录组分析,经过trinity软件组装得到130 592条Unigenes,平均长度为700 bp,其中68 976条Unigenes在NR、GO、KEGG、eggNOG、Swiss-Prot和Pfam数据库获得基因注释信息,仅占全部Unigenes的52.82%。39 572个Unigene被注释到GO数据库的生物学进程、细胞组分和分子功能三大类的52个小类中;参与KEGG的5大类代谢通路,34个代谢路径,共搜索到24 999个SSR位点,单核苷酸、两核苷酸和三核苷酸为黄连根部SSR的主要重复基序。黄连根茎与须根的差异表达基因有13 496个,在黄连须根中上调的差异基因有8 375个,下调的有5 121个。两者差异基因GO富集分析表明,跟次生代谢相关进程的前5项为次生代谢进程、次生代谢物生物合成过程、生物碱代谢过程、异喹啉生物碱生物合成过程和异喹啉生物碱代谢过程。在细胞组分分类中,膜结构、细胞壁和外封装结构为差异基因富集的前三;在分子功能分类中,跟氧化还原酶活性相关条目占差异基因富集显著的前四。在KEGG数据库中,共有3 749个差异基因定位到125个代谢途径中,其中,24个差异基因注释到异喹啉生物碱生物合成,在关联的8条KEGG通路中,筛选得到11个关键酶基因;同时,有39个差异基因注释到络氨酸代谢途径中,在关联的21条KEGG通路中,筛选得到10种关键酶基因。黄连根部转录组数据的获得为研究黄连异喹啉类生物碱的合成及黄连根茎与须根代谢差异奠定了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号