首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

2.
以10年以上树龄的杜仲雌株当年新发枝条上的幼果、嫩芽、叶片和树皮和雄株新发枝条上嫩芽、叶片和树皮为材料,采用Illumina Hi SeqTM2000高通量测序技术进行转录组测序,获得雌株51,574,000条、雄株52,430,502条Clean Reads数据,分别包含总长度为4,641,660,000nt和4,718,745,180nt核苷酸序列数据信息;经拼接组装,获得雌株基因信息长达69,461,730nt的423,339个Contig片段,获得雄株基因信息长达94,814,201nt的542,383个Contig片段;经进一步拼接,分别获得平均长度为288nt的雌株159,434个Unigene片段和平均长度为231nt的雄株257,288个Unigene片段,共有48,761个表达序列标签(EST)。以BLAST(E-value1.0E-5)将Unigene对NR、NT、KEGG和COG数据库进行比对,获得CDS序列35,541条,再通过ESTscan分析获得CDS片段13,220条,共获得48,761条CDS片段。与NR数据库比对发现杜仲雌、雄株转录组Unigene与葡萄相似序列最多(33.8%),其次是蓖麻(11.4%)和杨树(11.2%),与拟南芥的相似序列仅2.3%;根据Unigene与COG数据库比对结果,可将有COG功能的7,571条Unigene分为24类,而根据GO数据库注释,杜仲转录组有GO功能注释的23,314条Unigene可分为生物过程、细胞组分和分子功能3大类55分支。与KEGG数据库比对,杜仲雌、雄株转录组17,468条Ungenes分属128类代谢通路,其中有2,399条属于次生物质代谢途径,314条参与萜类化合物生物合成途径。  相似文献   

3.
[目的]利用高通量测序技术解析红脚艾(Artemisia rubripes Nakai)的转录组信息特征.[方法]通过高通量测序平台Illumina HiSeq 2500对红脚艾进行转录组测序,通过Trinity软件de novo组装获得Unigene,并基于序列同源性对Unigene进行功能注释,得到红脚艾的转录组信息.[结果]测序数据经过质控后共获得24126043条高质量的reads,通过de novo组装获得173093个转录本,对组装的转录本去冗余后共获得85991个Unigene,平均长度为616.87 bp,N50为925 bp.共有47216个Unigene在NR、KEGG、COG、KOG、GO数据库获得功能注释,40802个Unigene在NR数据库注释,显示红脚艾与向日葵(Helianthus annuus)的单基因匹配率最高,16846个Unigene被KEGG数据库注释到130条代谢途径中,26171个Unigene被注释到25个KOG功能分类中,23203个Unigene被GO注释到生物过程、细胞组成和分子功能三大类51个功能分类,12810个Unigene被注释到25个COG功能分类中.[结论]利用高通量测序技术获得了红脚艾转录组信息特征,这些数据将为后期开展功能基因鉴定、解析化合物次生代谢途径及其调控机制奠定研究基础.  相似文献   

4.
旱柳转录组测序及生物学分析   总被引:1,自引:0,他引:1  
对盐敏感旱柳沿江柳和耐盐旱柳9901的杂交F_1代根部进行了RNA-Seq测序和分析,共获取了107 950条Unigene,平均长度为1 076.96 bp。通过与COG、GO等8个数据库比对,60 848个基因获得注释信息,其中38 182条Unigene在GO数据库中获得注释,24 101条Unigene在KEGG数据库中获得注释。GO和KEGG富集分析结果表明,差异表达基因主要调节核糖体代谢、植物激素信号转导等生物学功能。  相似文献   

5.
基于边合成边测序(Sequencing By Synthesis,SBS)技术,使用Illumina Hi Seq2500高通量测序平台对长白落叶松c DNA文库进行测序。共获得非重复序列基因58 683条,总长度为55 283 938 bp。将得到的转录本使用BLAST软件将非重复序列基因序列与NR、Swiss-Prot、GO、COG、KEGG数据库比对,通过选择BLAST参数Evalue不大于10-5,最终获得29 350个有注释信息的基因序列,其中19 292个转录本注释GO编号,有9 112个转录本在COG数据库中被注释并分为25个功能分类,同时注释到120条KEGG代谢途径。在得到注释的转录本中搜索到木质素相关基因共68条,其中与木质素合成相关基因29条,与木质素分解代谢相关基因27条;找到了147条纤维素相关基因,其中与纤维素合成相关基因103条,与纤维素分解代谢相关基因44条。  相似文献   

6.
基于边合成边测序( Sequencing By Synthesis ,SBS)技术,使用Illumina HiSeq2500高通量测序平台对长白落叶松cDNA文库进行测序。共获得非重复序列基因58683条,总长度为55283938 bp。将得到的转录本使用BLAST软件将非重复序列基因序列与NR、Swiss-Prot、GO、COG、KEGG数据库比对,通过选择BLAST参数E-value不大于10-5,最终获得29350个有注释信息的基因序列,其中19292个转录本注释GO编号,有9112个转录本在COG数据库中被注释并分为25个功能分类,同时注释到120条KEGG代谢途径。在得到注释的转录本中搜索到木质素相关基因共68条,其中与木质素合成相关基因29条,与木质素分解代谢相关基因27条;找到了147条纤维素相关基因,其中与纤维素合成相关基因103条,与纤维素分解代谢相关基因44条。  相似文献   

7.
运用高通量技术对杂交鳢进行转录本测序和数据分析,经拼接与组装,最终获得52 065条unigenes,长度范围201~12 407 bp,序列平均长度为710 bp。从长度分布、GC含量和基因表达量等方面对unigenes进行评估,数据显示测序质量较好。进一步的数据分析,共鉴定出20 535个CDS,37 324个SNP位点和7 830个微卫星。用6大数据库Swiss–Prot、Nr、Pfam、KEGG、KOG和GO注释杂交鳢转录组unigenes,分别对应有20 955、28 938、19 339、14 052、19 358和18 635条unigenes获得注释。根据GO数据库的注释,可将这些unigenes分为生物过程、细胞组分和分子功能3大类共50亚类。KEGG代谢通路分析表明,这些unigenes参与了5大类30亚类共268个代谢通路,其中,参与信号转导通路的unigenes数量最多,有1 716条。  相似文献   

8.
miR-146a在一些癌症生理学过程如肺癌、肝癌、黑色素瘤中具有重要的调节作用。为了揭示miR-146a在羊驼黑色素细胞中的生物学功能,利用RNA-Seq的高通量测序技术从基因组转录水平解析miR-146a可能的分子作用机制,经Illumina sequencing平台测序并进行生物信息学分析。结果表明,miR-146a转染组和对照组羊驼黑色素细胞的转录表达谱,各样品纯数据均达到6.34 Gb,Q30碱基百分比在87.44%以上;组装后共获得161 666条序列,其中长度在1 kb的序列有20 019条。对序列进行功能注释,包括与NR、Swiss-Prot、KEGG、COG、KOG、GO和Pfam数据库的比对,结果显示,共获得25 867条序列的注释结果,其中,SSR分析共获得10 963个SSR标记。功能分析结果表明,这些表达基因涉及多种GO分类及KEGG通路且与黑色素相关的GO分类和KEGG通路占有较大比例。结果显示,研究miR-146a在黑色素细胞中的功能及其分子机制,并获得了黑素细胞转录组图谱,可为进一步研究控制羊驼毛色生理和色素生成的基因表达网络提供宝贵的资源。  相似文献   

9.
【目的】开展荸荠球茎发育过程转录组测序研究,为研究荸荠球茎发育过程相关基因表达信息提供参考。【方法】运用高通量测序技术,对荸荠球茎不同发育时期进行转录组测序研究。【结果】组装共得到223 182条转录本和90 542条Unigene,平均长度为809 bp,N50为1119。组装完整性较高,效果较好。对所得Unigene进行不同数据库注释,共有50 583条Unigene成功注释到7个数据库(NR、GO、NT、Pfam、KEGG、KOG及Swiss-prot)。对差异表达基因分析,发现球茎膨大初期的差异表达基因数目最多,为最活跃阶段。GO功能富集分析结果表明,33 205个基因获得功能注释,分为分子功能、细胞组分和生物学过程等3大类和54个亚类。COG功能分类结果表明,17 743个基因分布于25个功能区域,其中碳水化合物代谢占重要地位。KEGG代谢通路注释结果表明有20 667个基因获得功能注释,共有116条代谢途径,其中淀粉-蔗糖代谢占主要作用。【结论】利用高通量转录组测序技术首次建立了荸荠优良品种‘桂蹄3号’球茎的转录组数据库,为进一步研究荸荠球茎淀粉生物合成相关基因的功能及形成的分子机制提供了数据基础。  相似文献   

10.
【目的】研究3种白鲫杂交子代转录组学特征,为揭示鲫鲤杂交优势的分子机理提供理论依据,同时为在生产上培育出生长速度快、肉质好、适应能力强的杂交品种提供技术参考。【方法】以白鲫(♀)×黑龙江野鲤(♂)杂交子代(简称HB)、白鲫(♀)×散鳞镜鲤(♂)杂交子代(简称SB)和白鲫(♀)×兴国红鲤(♂)杂交子代(简称XB)为研究对象,利用RNA-seq高通量测序技术构建3种白鲫杂交子代转录组文库,以HiSeq PE150进行测序分析,原始序列经Trinity组装后进行功能注释(E-value1e-5);以DESeq2 R鉴定差异表达基因,利用GOseq R和KOBAS分别对差异表达的基因进行GO和KEGG富集分析;并采用MicroSAtellite对转录本中的SSR位点进行挖掘。【结果】共组装得225858条unigenes,平均长度为668 bp,N50为938 bp,有171461条unigenes可注释到蛋白质数据库(Nr)、非冗余核苷酸数据库(Nt)、蛋白质序列数据库(SwissPort)、基因本体论(GO)、直系同源基因簇(COG/KOG)和京都基因与基因组百科全书(KEGG)数据库中,注释比例为75.92%。其中,52630条unigenes注释到NR数据库,43659条unigenes注释到SwissPort数据库,35756条unigenes注释到COG/KOG数据库,包括生化代谢、信号转导机制、防御系统和细胞结构等。差异表达基因KEGG分析结果显示,较多的差异表达基因注释到内吞作用、Jak-STAT信号通路、溶酶体、吞噬体和Wnt信号通路等免疫相关及与生长发育相关的MAPK信号通路、Hippo信号通路和背腹轴形成等通路中。此外,从获得的转录组序列中共鉴定出20272个SSR位点,大多数为二核苷酸重复基元(占62.15%)。【结论】不同白鲫杂交子代间存在较多的差异表达基因,从中获得参与抗氧化、免疫和生长发育相关的通路和基因序列,且挖掘出20272个SSR位点,有助于选择性育种、分子标记开发及开展遗传多样性、遗传图谱构建和QTL定位等研究。  相似文献   

11.
【目的】掌握不同生长规格墨瑞鳕个体间差异表达基因的表达特点,为其功能相关基因深度挖掘及分子遗传育种提供科学依据。【方法】挑选同一养殖条件下极大个体和极小个体的墨瑞鳕,构建肌肉组织cDNA文库后,采用Illumina HiSeqTM 4000测序平台对存在生长差异的墨瑞鳕肌肉组织进行转录组测序分析,获得的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等数据库中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行GO功能注释及KEGG信号通路富集分析,并采用MISA进行SSR鉴定分析。【结果】从墨瑞鳕肌肉组织中共测序获得39749条Unigenes,其长度范围在301~55230 bp,平均长度为1705 bp。注释到Nt、Nr、Swiss-Prot、Pfam数据库的Unigenes分别有27046、20824、18268和17772条,在7个数据库中均得到注释的Unigenes共计6742条,占Unigenes总数的16.96%。根据差异表达基因筛选条件P<0.05且|log2 Fold Change|>1,共筛选出722个差异表达基因,其中上调基因308个、下调基因414个。差异表达基因GO功能注释分析结果表明,注释基因数目较多的GO功能条目包括细胞过程、代谢过程、膜、细胞器及结合等;KEGG信号通路富集分析发现,差异表达基因被成功富集到234条信号通路上,主要涉及磷脂酰肌醇3激酶/蛋白激酶信号通路、MAPK信号通路、胰岛素信号通路及FoxO信号通路等。在39749条Unigenes中鉴定筛选出22120个SSRs,占Unigene总数的55.65%,SSR的平均间距为3063 bp。【结论】基于转录组测序分析获得的墨瑞鳕肌肉组织差异表达基因以发挥结合、细胞过程及代谢过程等功能为主,且主要富集在PI3K-Akt信号通路、核糖体信号通路、FoxO信号通路及细胞凋亡等能量代谢相关通路上,通过共同协调而对墨瑞鳕的生长发育起调控作用。  相似文献   

12.
【目的】探究脊尾白虾(Exopalaemon carinicauda)鳃组织在渐变式低氧—复氧胁迫下的分子调控机制,为今后开展脊尾白虾耐低氧品系(种)的选育提供理论指导。【方法】通过模拟自然低氧环境的形成过程,分别于低氧处理0(对照)、3和6 h及复氧后1和8 h采集脊尾白虾鳃组织,利用Illumina HiSeqTM 4000测序平台进行转录组测序分析,经过滤和Trinity组装获得Unigenes,选取Nr、Swiss-Prot、KEGG和COG/KOG等数据库进行注释分析,在Omicsmart平台上完成差异表达基因筛选及其表达趋势分析,然后进行GO功能注释分析和KEGG信号通路富集分析,并随机选取5个差异表达基因进行实时荧光定量PCR验证。【结果】脊尾白虾鳃组织样本转录组测序数据经过滤后的Cleanreads进行Trinity组装共获得93227条Unigenes,其长度范围在201~35402 bp,平均长度为834 bp,N50长度为1352 bp。通过组间两两比较分析,共鉴定出4750个差异表达基因,其中上调差异表达基因3557个、下调差异表达基因2829个;超过50%的差异表达基因被显著富集到6种基因表达趋势模式中(P<0.01),具体表现为:Profile 0模式富集到415个基因,Profile 5模式富集到201个基因,Profile 11模式富集到371个基因,Profile 13模式富集到841个基因,Profile 17模式富集到387个基因,Profile 18模式富集到411个基因。6种基因表达趋势模式中的差异表达基因被注释到代谢进程、细胞进程、单一有机体进程、细胞、细胞零件、大分子复合物及催化活性等GO功能条目上;而KEGG信号通路富集分析结果显示,以Profile 13模式中的差异表达基因富集到最多信号通路(86条),其中呈显著富集的有8条,分别为核糖体、碳代谢、氧化磷酸化、氨基酸生物合成、内质网蛋白质加工、糖酵解/糖异生、谷胱甘肽代谢和蛋白输出。【结论】脊尾白虾鳃组织在受低氧胁迫早期通过合成蛋白质及提高代谢能力来抵御低氧环境,随着低氧胁迫时间的延长,物质合成和能量代谢活动均显著下降;但在复氧后随着复氧时间的延长,其蛋白质合成和能量代谢水平又逐渐升高恢复至常氧水平。  相似文献   

13.
旨在分析一株牦牛源植物乳杆菌SWUN5815的全基因组序列测序,并对该菌株的功能特性基因进行挖掘。基于PacBio RSII测序平台对乳杆菌SWUN5815进行全基因组测序分析和GO、KEGG、COG和NR数据库进行基因组基本功能注释。结果表明:1)植物乳杆菌SWUN5815的基因组大小为3.27 Mb,GC含量44.59%;2)预测到3 258个编码基因,编码基因总长度为2 814 147bp,平均长度为864bp;3)编码基因通过功能数据库对该菌株基因组基本功能注释和代谢通路基因信息注释得知,SWUN5815基因组中包括5个基因参与抗氧化活性过程,2个基因参与免疫过程;基因组中包含了抗生素、生物降解等代谢过程;可调控免疫和炎症的相关通路;基因组中含有18种已知细菌素基因;有4个合成ABC型细菌素转运系统的功能序列。综上,SWUN5815全基因组测序及分析挖掘其特异性功能基因有利于研究其益生特性提供基础,为菌株作为抗生素替代品的益生菌和饲料添加剂的应用研究提供了重要的参考数据。  相似文献   

14.
【目的】对青花菜花蕾进行转录组测序分析,并挖掘与蜡粉合成相关基因,为探明青花菜花球表面蜡粉形成的分子机制提供理论参考。【方法】分别提取野生型和蜡粉缺失型青花菜花球总RNA,采用Illumina HiSeqTM 2500平台进行转录组测序,获得高质量Clean reads,采用Trinity进行序列组装后获得青花菜Unigene库,将获得的Unigene序列与Nr、Nt、KEGG、Pfam、KOG/COG、Swiss-Prot和GO数据库比对,获得基因功能注释信息;使用DESeq2进行差异表达分析。【结果】共获得44.68 Gb Clean data,De novo组装得到41244条Unigenes,N50长度为1847 bp。从所获得的Unigenes中筛选出8685个差异表达基因(DEGs)(上调基因5747个,下调基因2938个),共有8038个基因被注释到不同数据库,其中,5220个基因注释到Pfam数据库; 2066个基因注释到COG数据库,3866个基因注释到KOG数据库; 2580个差异表达基因被注释到75个转录因子家族中,注释最多的是MYB家族(235个);GO数据库中6095个差异表达基因注释到细胞组分、分子功能和生物学过程三大类的52个功能分类; KEGG数据库中,1671个差异表达基因富集到138条代谢通路,其中13个差异表达基因与脂肪酸合成有关,7个差异表达基因与蜡粉生物合成途径有关。【结论】转录因子MYB家族在调控青花菜蜡粉合成中发挥重要作用。蜡粉合成过程中相关酶基因的差异表达是调控青花菜蜡粉合成的关键,尤其是野生型和蜡粉缺失突变体中特异性表达的差异表达基因,可作为后续研究青花菜花球表面蜡粉形成分子机制的对象。  相似文献   

15.
【目的】探明水杨酸(SA)对苹果叶片基因转录调控的影响,鉴定SA信号途径及其调控基因,为研究SA介导的抗病分子机制提供理论依据。【方法】生长30 d的‘嘎啦’组培苗叶片用2 mmol·L-1水杨酸(SA)处理12 h,以CTRL(0.2%乙醇)处理作为对照,利用Illumina Hi Seq TM 2000进行转录组测序,通过综合的生物信息学分析(差异基因筛选、条件特异性分析、GO分类及KEGG富集分析等)筛选SA信号途径的调控基因。克隆受SA特异性诱导表达基因的启动子,利用苹果细胞原生质体转化技术,进行启动子活性鉴定,确定对SA进行特异性响应的核苷酸序列。【结果】CTRL和SA处理分别获得750 439 459 bp和751 596 153 bp的原始数据,分别有44.77%和43.88%与‘金冠’苹果基因组完全匹配。获得3 329个显著性差异基因,包括苯丙烷类、类黄酮等次生代谢物生物合成途径的相关基因(如木质素合成关键酶CAD、细胞色素P450、真菌抗性相关的β-1,3-葡聚糖酶等),调控植物病原菌互作途径重要功能基因(钙调蛋白Ca M、抗病蛋白RPM1、热激蛋白HSP90、WRKY转录因子等)以及33个条件特异性诱导表达基因(NAC转录因子、NIMIN1、WRKY40、ERF转录因子等)。其中1 085个基因上调,2 244个基因下调。差异基因主要涉及细胞过程、代谢过程和基因绑定、催化活性等;根据转录组学的结果,将SA响应基因Md WRKY40的启动子序列克隆到含有荧光素酶基因的表达载体中,置于荧光素酶基因的上游,转化苹果原生质体细胞。SA处理的原生质体细胞,荧光素酶的活性为未经SA处理的20.6倍,而脱落酸(ABA)、茉莉酸(JA)、1-氨基环丙烷羧酸(ACC)对荧光素酶的活性没有影响,说明该启动子为苹果中对SA进行特异性响应的启动子序列。不同区段的启动子片段对SA响应能力不同,从Md WRKY40翻译起始位点ATG向上游500—1 000 bp只能响应高浓度SA,而对低浓度SA不具有响应能力,1 500 bp片段对高浓度SA响应能力进一步显著增强,对低浓度SA响应也有微弱提高;而长度为2 000 bp的核苷酸片段无论对高浓度SA还是对低浓度SA都具有显著响应能力,且达到最强。与2 000 bp片段相比,2 500 bp的核苷酸片段没有进一步增强启动子片段对SA的响应能力。超表达Md WRKY40蛋白对其自身的转录具有抑制作用。【结论】2 mmol·L-1 SA处理所影响的基因主要参与了苯丙烷类、类黄酮的生物合成,植物病原菌互作及植物激素信号转导途径。位于Md WRKY40开放阅读框上游的2 500 bp核苷酸序列,为对SA进行特异性响应的核苷酸启动子序列。在1 000—1 500 bp及1 500—2 000 bp具有显著提高启动子对SA敏感性的未知核苷酸序列,另外,Md WRKY40转录调控存在反馈抑制机制。  相似文献   

16.
为进一步开发大竹蛏Solen grandis的基因资源,采用2代Illumina Hi-seq测序技术对大竹蛏的鳃组织进行了转录组测序,构建了转录组数据库,获得338 483 476条Clean Reads数据;拼接组装后获得190 856条Unigene数据,平均长度为1147 bp;与NR、NT、KO、Swiss Prot、PFAM、GO、KOG等数据库进行Blast信息比对(E-value为10-5),共获得63 337个注释基因;与NR数据库比对发现,大竹蛏转录组基因序列与长牡蛎Crassostrea gigas具有较高的同源性,为53.3%;将大竹蛏转录组的Unigene的功能通过与KOG数据库进行注释比对划分为25类;GO数据库注释可分为三类,即细胞组分、生物过程和分子功能,共包括65个分支;KEGG分析发现,大竹蛏转录组数据中按照代谢通路可分为92类,利用Blast蛋白库比对和Estscan软件进行ORF预测,获得长度大于300 nt的ORF共50 681个;通过SSR分析,共获得73 089个SSR标记。本研究中获得的转录组信息可为今后进行大竹蛏分子标记的开发和关键基因的克隆及功能分析等研究提供基础数据。  相似文献   

17.
【目的】鉴定筛选出与卵形鲳鲹卵巢发育相关的候选基因及信号通路,为揭示其卵巢性成熟过程的分子机制打下基础。【方法】挑选卵巢发育处于?期和Ш期的雌性卵形鲳鲹,分别构建卵形鲳鲹卵巢?期和Ш期的cDNA文库,采用Illumina HiSeqTM 2500进行转录组测序,经过滤、质量控制及拼接组装后获得的Unigenes在七大数据库(Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO)中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行功能注释及信号通路富集分析,并采用MISA和GATK3进行SSR鉴定及SNP分析。【结果】卵形鲳鲹卵巢组织转录组测序获得的325156432条Raw reads,经过滤筛选得到317206752条Clean reads,拼接组装后得到59554条Unigenes;69.65%的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等七大数据库中注释成功,其中有24599条Unigenes被注释到GO数据库,15997条Unigenes被注释到KEGG数据库。在卵形鲳鲹卵巢组织的2个发育时期共鉴定获得56115个基因,经差异表达分析后获得17737个差异基因,其中8169个基因在卵巢Ш期上调表达、9568个基因在卵巢Ш期下调表达。GO功能注释分析发现,卵形鲳鲹卵巢差异表达基因主要注释在细胞过程、氮化合物代谢过程、初级代谢过程、核、核部分、离子结合及水解酶活性等条目上;而KEGG信号通路富集分析结果显示,17737个差异表达基因显著富集在318条代谢途径上,其中前20条KEGG信号通路包括2-氧代羧酸代谢、PI3K-Akt信号通路、甲状腺激素信号通路、磷脂酶D信号通路、Fc εRI信号通路和细胞周期等。卵形鲳鲹卵巢转录组(59554条Unigenes)中共存在30133个SSRs和82490个SNPs。【结论】GnRHR、FSHR、FSHβ、CYP11A、SIRT3和PEG3等差异表达基因及PI3K-Akt信号通路和VEGF信号通路等与卵形鲳鲹卵巢的发育密切相关,共同调节卵巢的发育与成熟,在卵巢性成熟过程中发挥重要作用。  相似文献   

18.
【目的】利用第三代纳米孔(nanopore)长读段测序技术对蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)的纯化菌丝(Aam)和孢子(Aas)进行测序,构建和注释球囊菌的高质量全长转录组。【方法】通过Oxford Nanopore PromethION平台对Aam和Aas进行测序。利用Guppy软件对原始读段(raw reads)进行碱基识别(base calling),通过过滤短片段和低质量原始读段得到有效读段(clean reads)。通过识别两端引物鉴定全长转录本序列。通过比对Nr、Swissprot、KOG、eggNOG、Pfam、GO和KEGG数据库获得全长转录本的注释信息。分别利用CPC、CNCI、CPAT、Pfam 4种方法对长链非编码RNA(long non-coding RNA,lncRNA)进行预测,取四者的交集作为高可信度的lncRNA。【结果】Aam和Aas的纳米孔测序分别测得6 321 704和6 259 727条原始读段,经质控得到5 669 436和6 233 159条有效读段,其中包含的全长有效读段分别为4 497 102(79.32%)和4 963 101(79.62%)条。共鉴定到9 859和16 795条非冗余全长转录本,N50分别为1 482和1 658 bp,平均长度分别为1 187和1 303 bp,最大长度分别为6 472和6 815 bp。Venn分析结果显示有6 512条非冗余全长转录本为菌丝和孢子所共有,分别有3 347和10 283个非冗余全长转录本为二者特有。此外,在球囊菌菌丝和孢子中共鉴定到20 142条全长转录本,其中分别有20 809、11 151、17 723、12 164、11 340和9 833条全长转录本可注释到Nr、KOG、eggNOG、Pfam、GO和KEGG数据库。注释全长转录本数量最多的物种是球囊菌、Polytolypa hystricis和荚膜组织胞浆菌(Histoplasma capsulatum)。GO数据库注释结果显示,上述全长转录本可注释到45个功能条目,涉及细胞组件、细胞和细胞器等细胞组分相关条目;催化活性、结合和转运器活性等分子功能相关条目;以及细胞进程、代谢进程和单一组织进程等生物学进程相关条目。KEGG数据库注释结果显示,上述全长转录本还可注释到抗生素的生物合成、核糖体、氨基酸的生物合成、碳代谢和剪接体等49条通路。此外,鉴定到648条高可信度的lncRNA,包含480条基因间区lncRNA、119条反义链lncRNA和49条正义链lncRNA。【结论】构建和注释了球囊菌的首个高质量全长转录组,为探究球囊菌转录组的复杂性,完善参考基因组的序列和功能注释信息以及深入开展球囊菌可变剪接体的功能研究提供了关键依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号