首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 546 毫秒
1.
西方蜜蜂的基因注释信息优化及新基因鉴定   总被引:1,自引:1,他引:0  
西方蜜蜂(Apis mellifera)全基因组序列早在2006年就已公布,但其基因注释信息并不完善。本研究利用前期获得的意蜂幼虫肠道RNA-seq数据对西方蜜蜂基因组的已知基因进行结构优化,对新基因进行预测、鉴定和分析。利用Cufflink软件进行转录本重构,进而与参考转录本序列进行比较,共对4 177个已公布西方蜜蜂基因的测序结果进行了优化,其中5′端延长、3′端延长、5′和3′端都延长的基因分别有2 383、2 392和2 384个。利用Cuffcompare软件将重构转录本与参考基因组进行比对,共预测出197个西方蜜蜂新基因,随机挑选20个新基因进行RT-PCR验证,有18对引物成功扩增出符合预期的目的片段。GO分类结果显示这些新基因涉及运输和代谢、能量代谢和信号分子和交互等21个GO terms。KEGG代谢通路(pathway)富集分析结果显示这些新基因富集于13个pathways,其中基因富集数最多的是细胞进程、单一有机体和结合。本研究为西方蜜蜂基因组信息提供了有益的补充和完善,也为新基因的功能研究打下了基础。  相似文献   

2.
利用前期获得的中华蜜蜂(Apis cerana cerana)幼虫肠道转录组数据对东方蜜蜂(Apis cerana)基因组的已注释基因进行结构优化、对未注释的新基因进行预测、分析和鉴定:利用Cufflink软件对reads进行转录本重构,通过与参考转录本序列进行比较,共对3 366个东方蜜蜂的基因结构进行了优化;利用Cuffcompare软件将重构转录本与参考基因组进行比对,共预测出527个东方蜜蜂的新基因,其中234个新基因在Nr数据库中存在注释信息;随机选取12个新基因进行PCR鉴定,有11个能够扩增出符合预期的目的片段,表明多数预测出的新基因真实存在;GO分类和KEGG代谢通路分析结果显示上述新基因可能在东方蜜蜂的生长发育、物质代谢、遗传信息传递等方面具有重要功能。本研究结果丰富和完善了东方蜜蜂基因组的基因结构与功能注释信息,也为新基因的功能研究打下基础。  相似文献   

3.
【目的】系统鉴定和分析中华蜜蜂(Apis cerana cerana)吞噬与包囊作用相关基因和全长转录本,为深入开展相关基因和剪接体的功能研究奠定基础。【方法】基于前期已获得的高质量中华蜜蜂纳米孔长读段测序数据,通过Blast工具将全长转录本比对Nr数据库筛选出吞噬与包囊作用相关基因和全长转录本。利用gffcompare软件将全长转录本与东方蜜蜂(Apis cerana)参考基因组上注释的转录本进行比较,鉴定未注释的新基因和新转录本。利用TAPIS pipeline预测和分析吞噬与包囊作用相关基因的可变多聚腺苷酸化(alternative polyadenylation,APA)位点,并通过TBtools软件鉴定APA位点上游的基序(motif)。使用Astalavista软件鉴定可变剪接(alternative splicing,AS)事件,并通过IGV浏览器进行结构可视化。通过RT-PCR验证AS事件的真实性。【结果】共鉴定到中华蜜蜂吞噬与包囊作用相关的基因66个和全长转录本395条,发掘出东方蜜蜂参考基因组未注释的2个新基因和303条新转录本。对参考基因组已注释的34个基因进行了结构优化,分别延伸了18个基因的5′端和12个基因的3′端,同时延长了4个基因的5′端和3′端。共鉴定到含有1个及以上APA位点的吞噬与包囊作用相关基因47个,其中多于5个APA位点的基因最多,为32个。在APA位点上游鉴定到多个基序,一致性序列为:GRBGCNKSDAACAAYTRBGCBMRNGGBYAYTAYWCNVWNGG。共鉴定到吞噬与包囊作用相关基因的AS事件296次,其中包括131次可变3′端剪接(alternative 3′splice site,A3SS)、85次内含子保留(intron retention,IR)、70次可变5′端剪接(alternative 5′splice site,A5SS)和10次外显子跳跃(exon skipping, ES)。RT-PCR结果显示,扩增的目的片段大小符合预期,证实了随机选择的2次AS事件的真实性。【结论】系统鉴定了中华蜜蜂吞噬与包囊作用相关基因和全长转录本以及AS事件和APA位点,优化了东方蜜蜂参考基因组注释的吞噬与包囊作用相关基因的结构。  相似文献   

4.
为深入开展中华蜜蜂相关研究提供参考信息和基础,利用已获得的纳米孔(Nanopore)测序数据对中华蜜蜂Apis cerana cerana的酚氧化酶(phenoloxidase, PO)和丝氨酸蛋白酶(serine protease, SP)相关基因和全长转录本进行发掘和分析。通过Blast工具将中华蜜蜂所有全长转录本比对KEGG和Nr数据库以筛选出PO和SP相关基因和全长转录本。采用gffcompare软件将PO和SP相关全长转录本与东方蜜蜂参考基因组(ACSNU-2. 0)已注释基因进行比较以优化结构。使用Astalavista软件鉴定PO和SP相关基因的可变剪接(alternative splicing, AS)事件,再利用IGV浏览器进行结构可视化。通过PCR验证AS事件的真实性。利用TAPIS pipeline预测和分析可变多聚腺苷酸化(alternative polyadenylation, APA)位点,并通过TBtool软件鉴定APA位点上游的基序(motif)。鉴定到中华蜜蜂PO和SP相关的42个基因与146条转录本。优化了16个参考基因组已注释PO和SP相关基因的结构,其中5′端延长和3′端延长的基因均有7个,5′端和3′端同时延长的基因有2个。鉴定到PO和SP相关的10个基因的389次AS事件,其中最丰富的AS类型是5′端可变剪接。PCR结果证实了2次AS事件的真实性。共鉴定到34个PO和SP相关基因含有1个及以上的APA位点,其中含有3个APA位点的基因数量最多;在APA位点上游鉴定到多个motif,一致性序列为:GGHKSYWSHHTRATWTCNBHDMRRYWYRTNYTVACNGCKGCDCAYTGYR。鉴定到中华蜜蜂PO和SP相关的42个基因和146条全长转录本,优化了东方蜜蜂参考基因组已注释的PO和SP相关基因结构,并发掘出PO和SP相关基因的389次AS事件和237个APA位点。  相似文献   

5.
【目的】利用已获得的纳米孔全长转录组数据对现有的东方蜜蜂微孢子虫(Nosema ceranae)参考基因组的基因序列和功能注释进行完善。【方法】采用TransDecoder软件预测东方蜜蜂微孢子虫基因的开放阅读框(open reading frame,ORF)及相应的氨基酸。利用gffcompare软件将全长转录本与参考基因组注释的转录本进行比较,对基因组注释基因的非编码区向上游或下游延伸,修正基因的边界。利用MISA软件鉴定长度在500 bp以上的全长转录本的简单重复序列(simple sequence repeat,SSR)位点,包括单核苷酸重复、双核苷酸重复、三核苷酸重复、四核苷酸重复、五核苷酸重复、六核苷酸重复、混合SSR等类型。通过Blast工具将鉴定到的新基因和新转录本比对Nr、KOG、eggNOG、GO和KEGG数据库,从而获得功能注释。【结果】共预测出2 353个完整ORF,其中长度分布在0—100个氨基酸的ORF最多,占总ORF数的72.12%。共对东方蜜蜂微孢子虫的2 340个基因进行了结构优化,其中5′端延长的基因有1 182个,3′端延长的基因有1 158个。共鉴定到1 658个SSR,其中单核苷酸重复、双核苷酸重复、三核苷酸重复、四核苷酸重复的数量分别为1 622、23、7和6个;单核苷酸重复类型的SSR密度最大,达到182.32个/Mb,其次为混合SSR、双核苷酸重复和三核苷酸重复,分别达到6.90、2.78和0.73个/Mb。共鉴定出954个新基因,其中分别有951、333、371、422和321个新基因可注释到Nr、KOG、eggNOG、GO和KEGG数据库。此外,还鉴定出6 164条新转录本,其中分别有6 141、2 808、2 932、3 196和2 585条新转录本可注释到Nr、KOG、eggNOG、GO和KEGG数据库。新基因和新转录本注释数量最多的物种均为东方蜜蜂微孢子虫,其次是蜜蜂微孢子虫(Nosema apis)。【结论】研究结果较好地完善了现有的东方蜜蜂微孢子虫参考基因组已注释基因的序列和功能注释,并补充和注释了大量参考基因组未注释的新基因和新转录本。  相似文献   

6.
【目的】利用第三代纳米孔(nanopore)长读段测序技术对蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)的纯化菌丝(Aam)和孢子(Aas)进行测序,构建和注释球囊菌的高质量全长转录组。【方法】通过Oxford Nanopore PromethION平台对Aam和Aas进行测序。利用Guppy软件对原始读段(raw reads)进行碱基识别(base calling),通过过滤短片段和低质量原始读段得到有效读段(clean reads)。通过识别两端引物鉴定全长转录本序列。通过比对Nr、Swissprot、KOG、eggNOG、Pfam、GO和KEGG数据库获得全长转录本的注释信息。分别利用CPC、CNCI、CPAT、Pfam 4种方法对长链非编码RNA(long non-coding RNA,lncRNA)进行预测,取四者的交集作为高可信度的lncRNA。【结果】Aam和Aas的纳米孔测序分别测得6 321 704和6 259 727条原始读段,经质控得到5 669 436和6 233 159条有效读段,其中包含的全长有效读段分别为4 497 102(79.32%)和4 963 101(79.62%)条。共鉴定到9 859和16 795条非冗余全长转录本,N50分别为1 482和1 658 bp,平均长度分别为1 187和1 303 bp,最大长度分别为6 472和6 815 bp。Venn分析结果显示有6 512条非冗余全长转录本为菌丝和孢子所共有,分别有3 347和10 283个非冗余全长转录本为二者特有。此外,在球囊菌菌丝和孢子中共鉴定到20 142条全长转录本,其中分别有20 809、11 151、17 723、12 164、11 340和9 833条全长转录本可注释到Nr、KOG、eggNOG、Pfam、GO和KEGG数据库。注释全长转录本数量最多的物种是球囊菌、Polytolypa hystricis和荚膜组织胞浆菌(Histoplasma capsulatum)。GO数据库注释结果显示,上述全长转录本可注释到45个功能条目,涉及细胞组件、细胞和细胞器等细胞组分相关条目;催化活性、结合和转运器活性等分子功能相关条目;以及细胞进程、代谢进程和单一组织进程等生物学进程相关条目。KEGG数据库注释结果显示,上述全长转录本还可注释到抗生素的生物合成、核糖体、氨基酸的生物合成、碳代谢和剪接体等49条通路。此外,鉴定到648条高可信度的lncRNA,包含480条基因间区lncRNA、119条反义链lncRNA和49条正义链lncRNA。【结论】构建和注释了球囊菌的首个高质量全长转录组,为探究球囊菌转录组的复杂性,完善参考基因组的序列和功能注释信息以及深入开展球囊菌可变剪接体的功能研究提供了关键依据。  相似文献   

7.
对双孢蘑菇As2796子实体发育4个不同阶段样品的转录组进行测序,并与双孢蘑菇参考基因组进行序列比对。共比对到9 207个转录本,发掘新基因393个,其中164个得到功能注释。基于比对结果进行各基因在不同样品中的表达量分析,识别差异表达基因,发现原基期与其他3个不同发育时期有316个共同差异基因。对差异基因进行功能注释和富集分析,可为进一步研究双孢蘑菇子实体生长发育的相关基因奠定基础。  相似文献   

8.
对前期获得的家蚕中肠组织转录组数据进行进一步生物信息学分析,利用Cufflinks软件对Mapped Reads进行组装,并与参考基因组注释信息进行比对,共发掘新基因788个。利用Blast软件将发掘的新基因与NR,Swiss-Prot数据库比对,其中746个新基因得到功能注释。这些新发掘基因在家蚕28个连锁群上都有分布,其中在第15连锁群上最多。有198个新基因注释到KEGG数据库中,分布于85条已知的通路中,将新基因与COG数据进行比对,并进行功能注释与分类,总共有258个新基因得到了注释,被分为22个COG类别,部分新基因的克隆分析,与预期结果一致,这些发现为以后进一步研究新基因的功能提供了基础信息。  相似文献   

9.
采用Blast工具将已鉴定到的意大利蜜蜂(Apis mellifera ligustica,简称意蜂)全长转录本比对Nr数据库,共鉴定到意蜂Hippo信号通路中相关的49个基因及其550条全长转录本。运用Gffcompare软件将鉴定到的Hippo信号通路相关全长转录本与西方蜜蜂参考基因组(Amel_HAv3.1)上注释的转录本进行比较,分别延长西方蜜蜂参考基因组注释到Hippo信号通路的9个基因的5'' UTR和7个基因的3'' UTR。通过Astalavista软件鉴定到Hippo信号通路相关的4个基因的7次可变剪切(AS)事件,包括2次外显子跳跃、2次内含子保留和3次可变5''端剪接。通过PCR验证了1个基因的AS事件真实性。利用TAPIS pipeline鉴定到意蜂Hippo信号通路相关的24个基因含有1个及以上可变多聚腺苷酸化(APA)位点,其中含有1个APA位点的基因数量最多。通过TBtool软件鉴定APA位点上游motif的一致性序列HVNCCNBNDYVDVVHVNDBVDYCNBBDNNNHNNVNNVMNN。  相似文献   

10.
【目的】构建山羊(Capra hircus)全长转录组,旨在改进参考基因组的功能注释。【方法】利用PacBio长读段测序技术对南江黄羊肝、脾、肾周脂肪、背最长肌和睾丸5个组织的混合样本进行高通量测序;对原始数据进行校正、聚类去冗余,最后用KEGG数据库对预测转录本序列进行功能注释。【结果】质控后获得28 432条高质量一致性全长序列,其中99.49%的序列被成功比对到山羊基因组;得到源自9 879个基因的19 115个转录本。进一步分析得到表达基因总数的41.39%发生了可变剪接;其中起始外显子可变剪接占比最高(36.47%),外显子互斥占比最低(1.78%)。另外,144条序列未被比对到参考基因组上,这些序列的平均GC含量高达56.50%;利用KEGG数据库对其进行功能注释,揭示28个转录本与免疫系统相关。【结论】获得的测序数据全面涵盖混合样本中表达的转录本,证明了山羊基因组转录的复杂性。研究结果总体上提高了每个基因平均表达的转录本数量,证明可变剪接的广泛存在;未成功比对的转录本序列GC含量较高且许多转录本来自免疫基因的表达。  相似文献   

11.
旨在分析一株牦牛源植物乳杆菌SWUN5815的全基因组序列测序,并对该菌株的功能特性基因进行挖掘。基于PacBio RSII测序平台对乳杆菌SWUN5815进行全基因组测序分析和GO、KEGG、COG和NR数据库进行基因组基本功能注释。结果表明:1)植物乳杆菌SWUN5815的基因组大小为3.27 Mb,GC含量44.59%;2)预测到3 258个编码基因,编码基因总长度为2 814 147bp,平均长度为864bp;3)编码基因通过功能数据库对该菌株基因组基本功能注释和代谢通路基因信息注释得知,SWUN5815基因组中包括5个基因参与抗氧化活性过程,2个基因参与免疫过程;基因组中包含了抗生素、生物降解等代谢过程;可调控免疫和炎症的相关通路;基因组中含有18种已知细菌素基因;有4个合成ABC型细菌素转运系统的功能序列。综上,SWUN5815全基因组测序及分析挖掘其特异性功能基因有利于研究其益生特性提供基础,为菌株作为抗生素替代品的益生菌和饲料添加剂的应用研究提供了重要的参考数据。  相似文献   

12.
【目的】筛选出凡纳滨对虾生长发育的功能基因及代谢调控网络,揭示其生长发育的分子机制,为后续开展凡纳滨对虾分子生物学研究提供宝贵的基因数据来源。【方法】以快速生长群体和慢速生长群体的凡纳滨对虾肌肉组织为研究材料,通过Illumina HiSeqTM2500平台对构建的cDNA文库进行高通量测序分析,以StringTie进行拼接组装后利用DESeq2筛选差异表达基因,并基于KOG、GO、nr、COG、Swiss-Pro、KEGG和Pfam等数据库进行差异表达基因功能注释分析。【结果】经拼接组装共获得53458844条Clean reads,各样品Clean reads的Q30均在93.00%以上;Illumina测序获得的Clean reads与参考基因组的比对效率在87.75%~87.80%,说明转录组测序数据真实可靠。采用SnpEff进行SNP/InDel变异注释分析,结果显示,SNP位点中以A>G、G>A、C>T和T>C等4种类型的数量较多(14950~21562个),InDel位点则以SYNONYMOUS_CODING的数量最多(33630个)。使用StringTie对Mapped reads(比对到参考基因组的Reads)进行拼接,共发掘到4607个新基因,分别输入COG、GO、KEGG、KOG、Pfam、Swiss-Prot、eggNOG和nr数据库中进行序列比对,最终发现共有1098个新基因被注释,以被nr数据库注释的新基因数量最多(1077个),而被COG数据库注释的新基因数量最少(416个)。基于Q-value<0.05且Fold Change>2的筛选条件,共获得1408个差异表达基因(661个为显著上调表达基因,747个为显著下调表达基因);1408个差异表达基因被注释到53个GO功能条目中,其中,22条被注释到生物学过程(Biological process),16条被注释到细胞组分(Cellular component),15条被注释到分子功能(Molecular function);KEGG信号通路富集分析发现3条重要的信号通路,分别是溶酶体通路(Lysosome)、氨基糖和核苷酸糖新陈代谢(Amino sugar and nucleotide sugar metabolism)及鞘脂类代谢(Sphingolipid metabolism)。在溶酶体通路中,CTSL基因、Nramp基因、MyoG基因和Myf5基因在凡纳滨对虾快速生长群体肌肉组织中呈上调表达,而Trypsin基因呈下调表达。【结论】通过转录组测序分析从快速生长群体和慢速生长群体的凡纳滨对虾肌肉组织中筛选出1408个差异表达基因(661个为显著上调表达基因,747个为显著下调表达基因),主要富集在溶酶体、氨基糖和核苷酸糖新陈代谢及鞘脂类代谢等通路上,在对虾肌肉生长发育过程中发挥重要作用。  相似文献   

13.
14.
旨在通过miRNA测序技术对捻转血矛线虫阿苯达唑给药前后的耐药虫株差异表达miRNA及网络调控分析,获取其转录本中全miRNA表达谱及耐药相关差异表达基因和miRNA,探究miRNA在捻转血矛线虫阿苯达唑耐药虫株给药前后的差异。采用Illumina Hiseq2 000平台对捻转血矛线虫阿苯达唑耐药虫株给药前和给药后的虫体进行Small RNA-seq测序,将Raw Data与参考基因组和miRBase数据库进行比对分析,使用RNAhybrid、Miranda和TargetScan对miRNA靶基因进行预测,筛选捻转血矛线虫耐药虫株给药前后表达量显著差异的miRNA并通过Stem-loop qRT-PCR验证,同时对差异显著的miRNA-mRNA调控关系采用Cytoscape软件进行可视化分析。将靶基因向KEGG和GO两大权威数据库映射,预测和分析靶基因功能注释情况和参与调控的通路情况。结果显示:1)捻转血矛线虫阿苯达唑耐药虫株给药前和给药后共筛选出显著差异表达的miRNA 188个,其中125个上调,63个下调,且qRT-PCR结果与转录组测序结果表达情况一致。2)显著差异表达的144个miRNA共关联到353个miRNA-mRNA负调控关系,注释到46条GO功能条目以及代谢,运输和降解等327条通路。3)筛选出的候选靶基因主要富集在ABC转运蛋白,HIF-1信号通路,cGMP - PKG 信号通路以及P450药物代谢通路,证实在药物胁迫的影响下捻转血矛线虫主要通过代谢和转运的方式参与耐药性调控。本研究为捻转血矛线虫耐药性诊断辅助分子标记的筛选和虫体耐药性调控因素及作用机制的研究提供参考。  相似文献   

15.
为探明骆驼斯氏副柔线虫雌虫和雄虫的转录组差异,挖掘出与性别决定相关的功能基因,采用Illumina HiSeqTM2000分别对其雌虫和雄虫样本进行转录组测序,构建cDNA文库,通过建库质量评估和组装效率评估后对其进行功能注释及相关生物信息学分析。结果显示,比较雌虫和雄虫的转录本,获得6 430个差异表达基因,其中2 131个基因上调;4 299个基因下调。对差异表达基因进行GO功能分类,有341 328和714个Unigenes分别注释到生物学过程、细胞组成和分子功能三大类41个分支中。KEGG数据库分析,有1 116个差异表达基因参与到198条KEGG通路中,显著富集在机体免疫调节,卵母细胞成熟等通路。功能聚类分析中,雌虫样本在生殖发育、产卵、生殖行为中高表达;雄虫在主要精子蛋白、丝氨酸/苏氨酸特异性蛋白磷酸酶中高表达。此外,在雄虫和雌虫中筛选出Tab-3,Tab-5、Fem-1和Mog-3等10种线虫性别决定相关基因,以及8种雄性性别特异表达基因和4种雌性性别特异表达基因,这些基因在虫体性别决定和性别特异性表达中发挥重要作用。本研究利用生物信息学技术预测出雌虫和雄虫差异表达基因在功能分类和代谢通路等方面的生物学特征,挖掘出性别决定基因和性别特异性表达相关基因,为进一步开展斯氏副柔线虫的功能基因组学研究、药物靶点预测和疫苗候选基因筛选提供有价值的数据资源。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号