首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于纳米孔全长转录组数据完善东方蜜蜂微孢子虫的基因组注释
引用本文:陈华枝,范元婵,蒋海宾,王杰,范小雪,祝智威,隆琦,蔡宗兵,郑燕珍,付中民,徐国钧,陈大福,郭睿.基于纳米孔全长转录组数据完善东方蜜蜂微孢子虫的基因组注释[J].中国农业科学,2021,54(6):1288-1300.
作者姓名:陈华枝  范元婵  蒋海宾  王杰  范小雪  祝智威  隆琦  蔡宗兵  郑燕珍  付中民  徐国钧  陈大福  郭睿
作者单位:1福建农林大学动物科学学院(蜂学学院),福州 3500022福建农林大学蜂疗研究所,福州 350002
基金项目:国家现代农业产业技术体系建设专项(CARS-44-KXJ7);福建省自然科学基金(2018J05042);福建农林大学杰出青年科研人才计划(xjq201814);福建农林大学科技创新专项基金(CXZX2017342);福建农林大学科技创新专项基金(CXZX2017343);福建农林大学优秀硕士学位论文资助基金陈华枝
摘    要:【目的】利用已获得的纳米孔全长转录组数据对现有的东方蜜蜂微孢子虫(Nosema ceranae)参考基因组的基因序列和功能注释进行完善。【方法】采用TransDecoder软件预测东方蜜蜂微孢子虫基因的开放阅读框(open reading frame,ORF)及相应的氨基酸。利用gffcompare软件将全长转录本与参考基因组注释的转录本进行比较,对基因组注释基因的非编码区向上游或下游延伸,修正基因的边界。利用MISA软件鉴定长度在500 bp以上的全长转录本的简单重复序列(simple sequence repeat,SSR)位点,包括单核苷酸重复、双核苷酸重复、三核苷酸重复、四核苷酸重复、五核苷酸重复、六核苷酸重复、混合SSR等类型。通过Blast工具将鉴定到的新基因和新转录本比对Nr、KOG、eggNOG、GO和KEGG数据库,从而获得功能注释。【结果】共预测出2 353个完整ORF,其中长度分布在0—100个氨基酸的ORF最多,占总ORF数的72.12%。共对东方蜜蜂微孢子虫的2 340个基因进行了结构优化,其中5′端延长的基因有1 182个,3′端延长的基因有1 158个。共鉴定到1 658个SSR,其中单核苷酸重复、双核苷酸重复、三核苷酸重复、四核苷酸重复的数量分别为1 622、23、7和6个;单核苷酸重复类型的SSR密度最大,达到182.32个/Mb,其次为混合SSR、双核苷酸重复和三核苷酸重复,分别达到6.90、2.78和0.73个/Mb。共鉴定出954个新基因,其中分别有951、333、371、422和321个新基因可注释到Nr、KOG、eggNOG、GO和KEGG数据库。此外,还鉴定出6 164条新转录本,其中分别有6 141、2 808、2 932、3 196和2 585条新转录本可注释到Nr、KOG、eggNOG、GO和KEGG数据库。新基因和新转录本注释数量最多的物种均为东方蜜蜂微孢子虫,其次是蜜蜂微孢子虫(Nosema apis)。【结论】研究结果较好地完善了现有的东方蜜蜂微孢子虫参考基因组已注释基因的序列和功能注释,并补充和注释了大量参考基因组未注释的新基因和新转录本。

关 键 词:纳米孔测序  全长转录本  转录组  基因组  蜜蜂  东方蜜蜂微孢子虫  
收稿时间:2020-05-06
点击此处可从《中国农业科学》浏览原始摘要信息
点击此处可从《中国农业科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号