首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于边合成边测序( Sequencing By Synthesis ,SBS)技术,使用Illumina HiSeq2500高通量测序平台对长白落叶松cDNA文库进行测序。共获得非重复序列基因58683条,总长度为55283938 bp。将得到的转录本使用BLAST软件将非重复序列基因序列与NR、Swiss-Prot、GO、COG、KEGG数据库比对,通过选择BLAST参数E-value不大于10-5,最终获得29350个有注释信息的基因序列,其中19292个转录本注释GO编号,有9112个转录本在COG数据库中被注释并分为25个功能分类,同时注释到120条KEGG代谢途径。在得到注释的转录本中搜索到木质素相关基因共68条,其中与木质素合成相关基因29条,与木质素分解代谢相关基因27条;找到了147条纤维素相关基因,其中与纤维素合成相关基因103条,与纤维素分解代谢相关基因44条。  相似文献   

2.
采用Illumina Hi Seq 4000 SBS高通量测序平台对糙皮侧耳[Pleurotus ostreatus(Jacq.:Fr.)Kummer]的转录组进行测序,挖掘糙皮侧耳降解木质基质的候选功能基因。共得到糙皮侧耳转录本序列64 228条,单基因序列46 417条。使用Blast工具将转录本序列比对到NR、Swissprot、KEGG、String、Pfam等数据库中,并有33 736条序列得到注释。通过对差异基因的对比和筛选,得到1 408条差异表达基因,其中有1 183条基因为上调基因,通过GO富集分析表明,差异基因显著富集于木质素分解代谢过程、锰过氧化物酶活性、苯丙素分解代谢过程中。将差异基因比对到KEGG数据库中,共有313条得到注释的序列,对其进行Pathway富集分析,证明差异基因显著富集于氨基苯甲酸降解、色氨酸代谢、β-丙氨酸代谢等通路中。c27028_g1、c28624_g1、c30793_g1、c30849_g1等基因与木质素降解过程相关性较高。c24893_g1、c29559_g1、c29956_g2等基因与纤维素降解过程相关性较高。  相似文献   

3.
为探究月月竹竹秆受到光照由绿色变为紫色的分子机制,本研究采集月月竹同一竹节紫色部分(Z)、渐变部分(M)和绿色部分(L)的竹青,提取RNA,利用PacBio Sequel三代全长转录组测序技术,结合生物信息学方法对不同颜色的竹青进行全长转录组分析。结果表明,经过三代测序和数据质量控制,共获得非冗余转录本66 961条,长度为500~3 000 bp,平均长度1 389.22 bp,序列总长度为93.02 Mbp,N50为1 830 bp, G+C碱基含量为49.56%。利用NR、Swiss-Prot、COG、GO、KEGG和Pfam数据库对所有转录本进行功能注释,共有56 938条转录本被成功注释,占全部转录本的85.03%;49 115条转录本被GO注释,其中催化活性、细胞器、代谢过程分别是GO数据库分子功能、细胞组分和生物过程中含转录本最多的项目;28 231个转录本被KEGG数据库注释,其中与碳水化合物代谢和基因翻译相关的转录本最多。结合GO注释和KEGG注释,66 961条转录本中有381条转录本与光信号的感受、传递以及光调控相关,包括红光和远红光的受体蛋白PHYA、PHYB及...  相似文献   

4.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

5.
膜果麻黄种子不同发育时期的转录组测序分析   总被引:1,自引:0,他引:1  
以不同萌发期间的膜果麻黄(E.przewalskii)种子为研究对象,应用新一代高通量测序技术平台Illumina Hi SeqTM2000对其进行转录组测序和数据重新组装,结果获得了12 999 122条初始序列,总长为1 169 920 980bp,初始序列组装获得序列片段的平均长度与N50值分别为351和548 bp;与COG功能注释、GO分类及KEGG代谢通路分析后,获得了49 449个GO功能注释、17 751个COG功能注释以及16 748个KEGG注释;并从KEGG通路中找到有关芪类、二芳基庚烷和姜醇合成途径的编码基因片段230个。  相似文献   

6.
为探究可变剪接影响下更为复杂的脂肪沉积调控网络,明晰可变剪接事件的发生对脂肪沉积调控机制的影响,本研究基于PacBio测序平台的第三代测序技术,对夷陵黄牛腹腔脂肪、皮下脂肪、肌间脂肪进行全长转录组测序分析。共发现15 445个基因检测到50 520个可变剪接,占牛全部基因的33.4%。对这些基因进行富集分析发现,83个GO条目显著富集,这些显著富集的通路可能参与脂肪沉积网络的调控,其中16个与脂质合成及代谢相关,27条KEGG通路显著富集,其中15条与脂质合成及代谢相关。使用KOG、KEGG、NR、Swiss Prot、GO数据库对测序序列进行注释,80 756条序列共注释到69 259个基因,94 458条CDS序列及对应的pep序列。其中GO分析中15 039条序列富集到507个生物学过程条目,7 907条序列富集到214个细胞组分条目,30 672条序列富集到559个分子功能条目。KEGG数据分析富集到34条通路共49 710条序列,其中7 002条序列参与信号转导途径。以上结果表明,牛脂肪组织存在大量可变剪接事件,并且这些发生可变剪接事件的基因对脂肪沉积的调控发挥重要作用,这可...  相似文献   

7.
【目的】对青花菜花蕾进行转录组测序分析,并挖掘与蜡粉合成相关基因,为探明青花菜花球表面蜡粉形成的分子机制提供理论参考。【方法】分别提取野生型和蜡粉缺失型青花菜花球总RNA,采用Illumina HiSeqTM 2500平台进行转录组测序,获得高质量Clean reads,采用Trinity进行序列组装后获得青花菜Unigene库,将获得的Unigene序列与Nr、Nt、KEGG、Pfam、KOG/COG、Swiss-Prot和GO数据库比对,获得基因功能注释信息;使用DESeq2进行差异表达分析。【结果】共获得44.68 Gb Clean data,De novo组装得到41244条Unigenes,N50长度为1847 bp。从所获得的Unigenes中筛选出8685个差异表达基因(DEGs)(上调基因5747个,下调基因2938个),共有8038个基因被注释到不同数据库,其中,5220个基因注释到Pfam数据库; 2066个基因注释到COG数据库,3866个基因注释到KOG数据库; 2580个差异表达基因被注释到75个转录因子家族中,注释最多的是MYB家族(235个);GO数据库中6095个差异表达基因注释到细胞组分、分子功能和生物学过程三大类的52个功能分类; KEGG数据库中,1671个差异表达基因富集到138条代谢通路,其中13个差异表达基因与脂肪酸合成有关,7个差异表达基因与蜡粉生物合成途径有关。【结论】转录因子MYB家族在调控青花菜蜡粉合成中发挥重要作用。蜡粉合成过程中相关酶基因的差异表达是调控青花菜蜡粉合成的关键,尤其是野生型和蜡粉缺失突变体中特异性表达的差异表达基因,可作为后续研究青花菜花球表面蜡粉形成分子机制的对象。  相似文献   

8.
对黑紫色叶紫薇品种‘赤红’叶片进行高通量测序,并利用Trinity(2.8.6)对测序数据进行从头组装,共获得23 791条unigene,其中91.86%的序列在NR、GO、COG、KEGG等5大数据库中得到注释;NR数据库比对到的unigene数量最多,占比91.93%,随后依次为SWISS(67.95%)、COG(60.43%)、GO(51.37%)和KEGG(35.43%)。在NR数据库中,‘赤红’紫薇所有的unigene仅比对到1个物种——石榴(Punica granatum L.),表明同属于千屈菜科的紫薇和石榴亲缘关系较近。从转录组中共筛选到4 775个SSR位点,包括6种核苷酸重复类型,其中A/T和AG/CT类型占比最高。对色素合成相关通路基因进行分析,共挖掘到18个与类黄酮和花青素相关的基因,其中花青素合成通路中的UGT79B1、BZ1、UGT75C1可能是‘赤红’紫薇形成紫黑色叶的关键基因。  相似文献   

9.
[目的]利用高通量测序技术解析红脚艾(Artemisia rubripes Nakai)的转录组信息特征.[方法]通过高通量测序平台Illumina HiSeq 2500对红脚艾进行转录组测序,通过Trinity软件de novo组装获得Unigene,并基于序列同源性对Unigene进行功能注释,得到红脚艾的转录组信息.[结果]测序数据经过质控后共获得24126043条高质量的reads,通过de novo组装获得173093个转录本,对组装的转录本去冗余后共获得85991个Unigene,平均长度为616.87 bp,N50为925 bp.共有47216个Unigene在NR、KEGG、COG、KOG、GO数据库获得功能注释,40802个Unigene在NR数据库注释,显示红脚艾与向日葵(Helianthus annuus)的单基因匹配率最高,16846个Unigene被KEGG数据库注释到130条代谢途径中,26171个Unigene被注释到25个KOG功能分类中,23203个Unigene被GO注释到生物过程、细胞组成和分子功能三大类51个功能分类,12810个Unigene被注释到25个COG功能分类中.[结论]利用高通量测序技术获得了红脚艾转录组信息特征,这些数据将为后期开展功能基因鉴定、解析化合物次生代谢途径及其调控机制奠定研究基础.  相似文献   

10.
泸定百合是非常优良的种质基因资源,鳞茎研究是其科研和生产的关键环节,然而泸定百合鳞茎的分子生物学研究尚属空白。为揭示泸定百合鳞茎的分子机制,应用高通量测序技术对泸定百合的鳞茎进行转录组分析。原始数据经过生物信息学分析后,共获得4.9 G有效数据,43 412条Unigene;所获得的Unigene与NR,GO,COG和KEGG等数据库进行搜索比对后,发现有30 225条和21 531条Unigene分别获得NR和GO注释,14 069条Unigene得到COG注释,GO注释中获得374条Unigene可能作为转录因子参与泸定百合鳞茎的形成与发育;共有10 822条Unigene参与了KEGG代谢途径,其中有571条Unigene注释到次生代谢合成途径,其中66条和23条Unigene分别参与了萜类和生物碱的合成。研究结果为采用生物技术手段提高百合的药用成分的含量及改善其园艺性状积累了基本资料。  相似文献   

11.
利用毛葡萄叶片高通量转录组测序数据进行简单重复序列(simple sequence repeat,简称SSR)搜索并对其所在的序列进行注释,从而为毛葡萄分子标记开发提供有效信息。从35 238条质量较高的unigene中搜索到4 428个SSR位点,对这些序列进行基因本体(gene ontology,简称GO)、同源蛋白质簇(cluster of orthologous groups of proteins,简称COGs)和京都基因与基因组百科全书(Kyoto encyslopedia of genes and genomes,简称KEGG)分类,给出功能注释和Pathway注释,共注释了3 197条unigene。COG数据库将SSR序列分成25类,通过GO分类和KEGG富集性分析,将SSR序列分别归类于38个GO类别和103条通路。这些序列涉及了许多重要的生物功能和代谢途径,预示着这些潜在的标记可能与重要的生物功能有关,这些信息为毛葡萄分子标记的开发和应用奠定了基础。  相似文献   

12.
通过对白腐菌偏肿革裥菌(Lenzites gibbosa)在木质和非木质环境下的转录组进行测序,从而预测和筛选出L.gibbosa与木材降解有关的基因。采用高通量测序技术对木屑和非木屑处理条件下的菌丝样本进行转录组测序。利用eggNOG、GO等数据库注释方法对转录本进行比较分析,预测和筛选出L.gibbosa与木材降解有关的基因。L.gibbosa转录组测序两组试验组分别设置3个生物学重复样本,共得到6个样本42.71 Gb Clean Data,各样品Clean Data平均达到7.11 Gb,各样品的Reads与参考基因组的比对效率在88.51~91.37%。差异表达分析得到差异表达基因1 120个,其中上调370个,下调750个。差异基因被注释到GO数据库的有493个,注释到eggNOG数据库的有857个。eggNOG分析表明,差异基因表达多聚集在翻译后修饰、蛋白质折叠、蛋白分子伴侣;碳水化合物的运输和代谢;能量产生和转化;次生代谢产物的生物合成、运输和分解代谢等功能分类下。GO分析表明,显著性富集与频率较高的生物过程是氧化还原过程、氧化还原酶活性和木质素代谢过程。L.gibbosa降解木材与木质素分解代谢过程(GO:0046274)、氧化还原过程(GO:0055114)和氧化还原酶活性(GO:0016491)等3个基因本体功能类目密切相关。根据基因功能注释的结果得到7个与白腐菌降解木质素相关的重要差异表达基因。  相似文献   

13.
[目的]研究3种白鲫杂交子代转录组学特征,为揭示鲫鲤杂交优势的分子机理提供理论依据,同时为在生产上培育出生长速度快、肉质好、适应能力强的杂交品种提供技术参考.[方法]以白鲫(♀)×黑龙江野鲤(♂)杂交子代(简称HB)、白鲫(♀)×散鳞镜鲤(♂)杂交子代(简称SB)和白鲫(♀)×兴国红鲤(♂)杂交子代(简称XB)为研究对象,利用RNA-seq高通量测序技术构建3种白鲫杂交子代转录组文库,以HiSeq PE150进行测序分析,原始序列经Trinity组装后进行功能注释(E-value<1e-5);以DESeq2 R鉴定差异表达基因,利用GOseq R和KOBAS分别对差异表达的基因进行GO和KEGG富集分析;并采用MicroSAtellite对转录本中的SSR位点进行挖掘.[结果]共组装得225858条unigenes,平均长度为668 bp,N50为938 bp,有171461条unigenes可注释到蛋白质数据库(Nr)、非冗余核苷酸数据库(Nt)、蛋白质序列数据库(SwissPort)、基因本体论(GO)、直系同源基因簇(COG/KOG)和京都基因与基因组百科全书(KEGG)数据库中,注释比例为75.92%.其中,52630条unigenes注释到NR数据库,43659条unigenes注释到SwissPort数据库,35756条unigenes注释到COG/KOG数据库,包括生化代谢、信号转导机制、防御系统和细胞结构等.差异表达基因KEGG分析结果显示,较多的差异表达基因注释到内吞作用、Jak-STAT信号通路、溶酶体、吞噬体和Wnt信号通路等免疫相关及与生长发育相关的MAPK信号通路、Hippo信号通路和背腹轴形成等通路中.此外,从获得的转录组序列中共鉴定出20272个SSR位点,大多数为二核苷酸重复基元(占62.15%).[结论]不同白鲫杂交子代间存在较多的差异表达基因,从中获得参与抗氧化、免疫和生长发育相关的通路和基因序列,且挖掘出20272个SSR位点,有助于选择性育种、分子标记开发及开展遗传多样性、遗传图谱构建和QTL定位等研究.  相似文献   

14.
以宁夏贺兰县地方草石蚕(Stachys sieboldii)品种为试材,探讨应用第三代测序技术获得草石蚕全长转录本信息,应用第二代测序技术获得3个不同发育阶段草石蚕叶片和块茎的转录组信息,对测序结果进行转录组水平分析,筛选特有差异基因,并进行GO和KEGG富集分析,开展草石蚕基因表达特性的初步研究。结果表明,第三代测序后Polymerase read的数据量为50.82 G,FLNC序列的reads数为525 593个转录本;在KEGG等7大数据库的基因功能注释中均注释成功的转录本数目为6 857个,至少有1个数据库注释成功的转录本数目为14 078个;与NR数据库比对注释后,草石蚕与同为唇形目的芝麻(Sesamum indicum)基因序列相似性最高,相似基因个数为9 149个;与GO数据库比对注释后,生物学过程、细胞成分与分子功能中注释到基因个数最多的分别是新陈代谢过程5 093个、细胞2 004个、键联结合6 645个;与KEGG数据库比对注释后,在细胞转化、环境信息处理、遗传信息处理、新陈代谢和有机系统功能中注释到基因数最多的分别是运输和分解代谢409个、信号传导729个、转化...  相似文献   

15.
为研究绒山羊绒毛生长周期内皮肤基因表达规律以及皮肤差异表达基因的挖掘,采用Illumina HiSeqTM2000高通量转录组测序平台RNA-Seq技术,对3只成年雌性阿尔巴斯型内蒙古绒山羊全年12个月的皮肤样本进行转录组测序,将无参考基因组de novo拼接组装的unigene运用Nr,GO,COG以及KEGG数据库进行比对注释,并进行差异基因在全年各月份间的变化规律分析。结果显示,测序获得的unigene数为105 854条,比对注释基因55 541个,其中共有51 078条转录本进行了GO注释,21 189条转录本在COG数据库分析得到注释,26 201条预测基因KEGG数据库比对成功。其中皮肤基因GO注释在生物学功能分类中,细胞过程、代谢过程、生物学调控、生物功能调控以及刺激应答方面注释到的转录本比例最大;在分子功能分类中,结合以及催化活性作用方面注释到的转录本比例最大;通过COG数据库的比对注释,看到皮肤表达基因的同源蛋白功能主要集中在基因转录、翻译后修饰、和信号传导机制方面,反而在同工酶转运和代谢、细胞动力、二级代谢生物合成、转运和催化以及核结构方面注释到的基因极少;皮肤转录组数据与KEGG数据库比对,得到皮肤相关转录本较为富集的几条通路分别为MAPK signaling pathway,Wnt signaling pathway,Notch signaling pathway,Hedgehog signaling pathway,TGF-βsignaling pathway,JAK-STAT signaling pathway以及Focal signaling pathway;通过绒山羊不同月份皮肤转录组测序数据进行差异基因分析,得出绒山羊全年皮肤生长周期中基因差异变化规律为绒山羊全年皮肤共有4次较为剧烈的基因差异变化,第1次发生在2月与3月之间,第2次发生在3月与4月之间,第3次发生在6月与7月之间,第4次发生在10月与11月之间,前2次出现的基因差异变化较后2次剧烈得多,说明绒山羊绒毛生长启动时基因变化剧烈,而绒毛生长到休止时的皮肤基因变化较为缓和,是一个基因缓慢变化的过程。  相似文献   

16.
以10年以上树龄的杜仲雌株当年新发枝条上的幼果、嫩芽、叶片和树皮和雄株新发枝条上嫩芽、叶片和树皮为材料,采用Illumina Hi SeqTM2000高通量测序技术进行转录组测序,获得雌株51,574,000条、雄株52,430,502条Clean Reads数据,分别包含总长度为4,641,660,000nt和4,718,745,180nt核苷酸序列数据信息;经拼接组装,获得雌株基因信息长达69,461,730nt的423,339个Contig片段,获得雄株基因信息长达94,814,201nt的542,383个Contig片段;经进一步拼接,分别获得平均长度为288nt的雌株159,434个Unigene片段和平均长度为231nt的雄株257,288个Unigene片段,共有48,761个表达序列标签(EST)。以BLAST(E-value1.0E-5)将Unigene对NR、NT、KEGG和COG数据库进行比对,获得CDS序列35,541条,再通过ESTscan分析获得CDS片段13,220条,共获得48,761条CDS片段。与NR数据库比对发现杜仲雌、雄株转录组Unigene与葡萄相似序列最多(33.8%),其次是蓖麻(11.4%)和杨树(11.2%),与拟南芥的相似序列仅2.3%;根据Unigene与COG数据库比对结果,可将有COG功能的7,571条Unigene分为24类,而根据GO数据库注释,杜仲转录组有GO功能注释的23,314条Unigene可分为生物过程、细胞组分和分子功能3大类55分支。与KEGG数据库比对,杜仲雌、雄株转录组17,468条Ungenes分属128类代谢通路,其中有2,399条属于次生物质代谢途径,314条参与萜类化合物生物合成途径。  相似文献   

17.
旱柳转录组测序及生物学分析   总被引:1,自引:0,他引:1  
对盐敏感旱柳沿江柳和耐盐旱柳9901的杂交F_1代根部进行了RNA-Seq测序和分析,共获取了107 950条Unigene,平均长度为1 076.96 bp。通过与COG、GO等8个数据库比对,60 848个基因获得注释信息,其中38 182条Unigene在GO数据库中获得注释,24 101条Unigene在KEGG数据库中获得注释。GO和KEGG富集分析结果表明,差异表达基因主要调节核糖体代谢、植物激素信号转导等生物学功能。  相似文献   

18.
为探究磷脂酶基因家族在百合叶片中的表达情况,利用Illumina测序对百合正常叶片和叶烧病叶片进行转录组测序分析.测序共获得磷脂酶注释基因274个,分为PLA1、PLA2、PLB、PLC和PLD共5类.在KEGG、NR、COG和Swiss-prot等4个蛋白质数据库中都注释为磷脂酶基因的Unigene序列有34条,其中...  相似文献   

19.
miR-146a在一些癌症生理学过程如肺癌、肝癌、黑色素瘤中具有重要的调节作用。为了揭示miR-146a在羊驼黑色素细胞中的生物学功能,利用RNA-Seq的高通量测序技术从基因组转录水平解析miR-146a可能的分子作用机制,经Illumina sequencing平台测序并进行生物信息学分析。结果表明,miR-146a转染组和对照组羊驼黑色素细胞的转录表达谱,各样品纯数据均达到6.34 Gb,Q30碱基百分比在87.44%以上;组装后共获得161 666条序列,其中长度在1 kb的序列有20 019条。对序列进行功能注释,包括与NR、Swiss-Prot、KEGG、COG、KOG、GO和Pfam数据库的比对,结果显示,共获得25 867条序列的注释结果,其中,SSR分析共获得10 963个SSR标记。功能分析结果表明,这些表达基因涉及多种GO分类及KEGG通路且与黑色素相关的GO分类和KEGG通路占有较大比例。结果显示,研究miR-146a在黑色素细胞中的功能及其分子机制,并获得了黑素细胞转录组图谱,可为进一步研究控制羊驼毛色生理和色素生成的基因表达网络提供宝贵的资源。  相似文献   

20.
为获得岩原鲤转录组信息,发掘功能基因,本研究采用Illumina高通量测序技术对岩原鲤全组织转录组进行测序。结果获得64 257 918个EST序列,经拼接和组装得到83 252条单基因序列(unigene),平均长度787 bp,长度范围201~16 572 bp。利用NCBI的蛋白质非冗余数据库(Nr)对所有unigene进行相似性搜索,共有37 157条unigene(44.63%)与数据库中的已知序列同源。利用Blast2GO v2.5软件对unigene进行注释,共得到29 919条(35.93%)注释基因,根据GO功能分类将其分为生物过程、细胞组分和分子功能3大类56亚类。经KOG注释及分类,共有17 869条(21.49%)unigene成功注释到真核直系同源组中,并将其分为26个功能组分。经KEGG代谢通路分析可分为5大类(细胞过程、环境信息处理、遗传信息处理、代谢和有机系统)32小类共267个代谢通路。本研究通过高通量测序技术,对岩原鲤转录组进行测序,获得了大量的转录组信息,为岩原鲤功能基因克隆及基因组学研究提供了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号