首页 | 本学科首页   官方微博 | 高级检索  
     检索      

利用第三代纳米孔长读段测序技术构建和注释蜜蜂球囊菌的全长转录组
引用本文:杜宇,祝智威,王杰,王秀娜,蒋海宾,范元婵,范小雪,陈华枝,隆琦,蔡宗兵,熊翠玲,郑燕珍,付中民,陈大福,郭睿.利用第三代纳米孔长读段测序技术构建和注释蜜蜂球囊菌的全长转录组[J].中国农业科学,2021,54(4):864-876.
作者姓名:杜宇  祝智威  王杰  王秀娜  蒋海宾  范元婵  范小雪  陈华枝  隆琦  蔡宗兵  熊翠玲  郑燕珍  付中民  陈大福  郭睿
作者单位:1福建农林大学动物科学学院(蜂学学院),福州3500022福建农林大学蜂疗研究所,福州 3500023福建农林大学生命科学学院,福州3500024福建省病原真菌与真菌毒素重点实验室(福建农林大学),福州 350002
基金项目:国家现代农业产业技术体系建设专项(CARS-44-KXJ7);福建省自然科学基金(2018J05042);福建农林大学杰出青年科研人才计划(xjq201814);福建省病原真菌与真菌毒素重点实验室开放课题郭睿;江西省蜜蜂生物学与饲养重点实验室开放基金(JXKLHBB-2020-04);福建农林大学优秀硕士学位论文资助基金杜宇
摘    要:【目的】利用第三代纳米孔(nanopore)长读段测序技术对蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)的纯化菌丝(Aam)和孢子(Aas)进行测序,构建和注释球囊菌的高质量全长转录组。【方法】通过Oxford Nanopore PromethION平台对Aam和Aas进行测序。利用Guppy软件对原始读段(raw reads)进行碱基识别(base calling),通过过滤短片段和低质量原始读段得到有效读段(clean reads)。通过识别两端引物鉴定全长转录本序列。通过比对Nr、Swissprot、KOG、eggNOG、Pfam、GO和KEGG数据库获得全长转录本的注释信息。分别利用CPC、CNCI、CPAT、Pfam 4种方法对长链非编码RNA(long non-coding RNA,lncRNA)进行预测,取四者的交集作为高可信度的lncRNA。【结果】Aam和Aas的纳米孔测序分别测得6 321 704和6 259 727条原始读段,经质控得到5 669 436和6 233 159条有效读段,其中包含的全长有效读段分别为4 497 102(79.32%)和4 963 101(79.62%)条。共鉴定到9 859和16 795条非冗余全长转录本,N50分别为1 482和1 658 bp,平均长度分别为1 187和1 303 bp,最大长度分别为6 472和6 815 bp。Venn分析结果显示有6 512条非冗余全长转录本为菌丝和孢子所共有,分别有3 347和10 283个非冗余全长转录本为二者特有。此外,在球囊菌菌丝和孢子中共鉴定到20 142条全长转录本,其中分别有20 809、11 151、17 723、12 164、11 340和9 833条全长转录本可注释到Nr、KOG、eggNOG、Pfam、GO和KEGG数据库。注释全长转录本数量最多的物种是球囊菌、Polytolypa hystricis和荚膜组织胞浆菌(Histoplasma capsulatum)。GO数据库注释结果显示,上述全长转录本可注释到45个功能条目,涉及细胞组件、细胞和细胞器等细胞组分相关条目;催化活性、结合和转运器活性等分子功能相关条目;以及细胞进程、代谢进程和单一组织进程等生物学进程相关条目。KEGG数据库注释结果显示,上述全长转录本还可注释到抗生素的生物合成、核糖体、氨基酸的生物合成、碳代谢和剪接体等49条通路。此外,鉴定到648条高可信度的lncRNA,包含480条基因间区lncRNA、119条反义链lncRNA和49条正义链lncRNA。【结论】构建和注释了球囊菌的首个高质量全长转录组,为探究球囊菌转录组的复杂性,完善参考基因组的序列和功能注释信息以及深入开展球囊菌可变剪接体的功能研究提供了关键依据。

关 键 词:第三代高通量测序技术  纳米孔测序  全长转录本  参考转录组  蜜蜂  蜜蜂球囊菌  
收稿时间:2020-05-04
点击此处可从《中国农业科学》浏览原始摘要信息
点击此处可从《中国农业科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号