首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 437 毫秒
1.
【目的】鉴定筛选出与卵形鲳鲹卵巢发育相关的候选基因及信号通路,为揭示其卵巢性成熟过程的分子机制打下基础。【方法】挑选卵巢发育处于?期和Ш期的雌性卵形鲳鲹,分别构建卵形鲳鲹卵巢?期和Ш期的cDNA文库,采用Illumina HiSeqTM 2500进行转录组测序,经过滤、质量控制及拼接组装后获得的Unigenes在七大数据库(Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO)中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行功能注释及信号通路富集分析,并采用MISA和GATK3进行SSR鉴定及SNP分析。【结果】卵形鲳鲹卵巢组织转录组测序获得的325156432条Raw reads,经过滤筛选得到317206752条Clean reads,拼接组装后得到59554条Unigenes;69.65%的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等七大数据库中注释成功,其中有24599条Unigenes被注释到GO数据库,15997条Unigenes被注释到KEGG数据库。在卵形鲳鲹卵巢组织的2个发育时期共鉴定获得56115个基因,经差异表达分析后获得17737个差异基因,其中8169个基因在卵巢Ш期上调表达、9568个基因在卵巢Ш期下调表达。GO功能注释分析发现,卵形鲳鲹卵巢差异表达基因主要注释在细胞过程、氮化合物代谢过程、初级代谢过程、核、核部分、离子结合及水解酶活性等条目上;而KEGG信号通路富集分析结果显示,17737个差异表达基因显著富集在318条代谢途径上,其中前20条KEGG信号通路包括2-氧代羧酸代谢、PI3K-Akt信号通路、甲状腺激素信号通路、磷脂酶D信号通路、Fc εRI信号通路和细胞周期等。卵形鲳鲹卵巢转录组(59554条Unigenes)中共存在30133个SSRs和82490个SNPs。【结论】GnRHR、FSHR、FSHβ、CYP11A、SIRT3和PEG3等差异表达基因及PI3K-Akt信号通路和VEGF信号通路等与卵形鲳鲹卵巢的发育密切相关,共同调节卵巢的发育与成熟,在卵巢性成熟过程中发挥重要作用。  相似文献   

2.
【目的】掌握不同生长规格墨瑞鳕个体间差异表达基因的表达特点,为其功能相关基因深度挖掘及分子遗传育种提供科学依据。【方法】挑选同一养殖条件下极大个体和极小个体的墨瑞鳕,构建肌肉组织cDNA文库后,采用Illumina HiSeqTM 4000测序平台对存在生长差异的墨瑞鳕肌肉组织进行转录组测序分析,获得的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等数据库中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行GO功能注释及KEGG信号通路富集分析,并采用MISA进行SSR鉴定分析。【结果】从墨瑞鳕肌肉组织中共测序获得39749条Unigenes,其长度范围在301~55230 bp,平均长度为1705 bp。注释到Nt、Nr、Swiss-Prot、Pfam数据库的Unigenes分别有27046、20824、18268和17772条,在7个数据库中均得到注释的Unigenes共计6742条,占Unigenes总数的16.96%。根据差异表达基因筛选条件P<0.05且|log2 Fold Change|>1,共筛选出722个差异表达基因,其中上调基因308个、下调基因414个。差异表达基因GO功能注释分析结果表明,注释基因数目较多的GO功能条目包括细胞过程、代谢过程、膜、细胞器及结合等;KEGG信号通路富集分析发现,差异表达基因被成功富集到234条信号通路上,主要涉及磷脂酰肌醇3激酶/蛋白激酶信号通路、MAPK信号通路、胰岛素信号通路及FoxO信号通路等。在39749条Unigenes中鉴定筛选出22120个SSRs,占Unigene总数的55.65%,SSR的平均间距为3063 bp。【结论】基于转录组测序分析获得的墨瑞鳕肌肉组织差异表达基因以发挥结合、细胞过程及代谢过程等功能为主,且主要富集在PI3K-Akt信号通路、核糖体信号通路、FoxO信号通路及细胞凋亡等能量代谢相关通路上,通过共同协调而对墨瑞鳕的生长发育起调控作用。  相似文献   

3.
【目的】开展荸荠球茎发育过程转录组测序研究,为研究荸荠球茎发育过程相关基因表达信息提供参考。【方法】运用高通量测序技术,对荸荠球茎不同发育时期进行转录组测序研究。【结果】组装共得到223 182条转录本和90 542条Unigene,平均长度为809 bp,N50为1119。组装完整性较高,效果较好。对所得Unigene进行不同数据库注释,共有50 583条Unigene成功注释到7个数据库(NR、GO、NT、Pfam、KEGG、KOG及Swiss-prot)。对差异表达基因分析,发现球茎膨大初期的差异表达基因数目最多,为最活跃阶段。GO功能富集分析结果表明,33 205个基因获得功能注释,分为分子功能、细胞组分和生物学过程等3大类和54个亚类。COG功能分类结果表明,17 743个基因分布于25个功能区域,其中碳水化合物代谢占重要地位。KEGG代谢通路注释结果表明有20 667个基因获得功能注释,共有116条代谢途径,其中淀粉-蔗糖代谢占主要作用。【结论】利用高通量转录组测序技术首次建立了荸荠优良品种‘桂蹄3号’球茎的转录组数据库,为进一步研究荸荠球茎淀粉生物合成相关基因的功能及形成的分子机制提供了数据基础。  相似文献   

4.
【目的】筛选出凡纳滨对虾生长发育的功能基因及代谢调控网络,揭示其生长发育的分子机制,为后续开展凡纳滨对虾分子生物学研究提供宝贵的基因数据来源。【方法】以快速生长群体和慢速生长群体的凡纳滨对虾肌肉组织为研究材料,通过Illumina HiSeqTM2500平台对构建的cDNA文库进行高通量测序分析,以StringTie进行拼接组装后利用DESeq2筛选差异表达基因,并基于KOG、GO、nr、COG、Swiss-Pro、KEGG和Pfam等数据库进行差异表达基因功能注释分析。【结果】经拼接组装共获得53458844条Clean reads,各样品Clean reads的Q30均在93.00%以上;Illumina测序获得的Clean reads与参考基因组的比对效率在87.75%~87.80%,说明转录组测序数据真实可靠。采用SnpEff进行SNP/InDel变异注释分析,结果显示,SNP位点中以A>G、G>A、C>T和T>C等4种类型的数量较多(14950~21562个),InDel位点则以SYNONYMOUS_CODING的数量最多(33630个)。使用StringTie对Mapped reads(比对到参考基因组的Reads)进行拼接,共发掘到4607个新基因,分别输入COG、GO、KEGG、KOG、Pfam、Swiss-Prot、eggNOG和nr数据库中进行序列比对,最终发现共有1098个新基因被注释,以被nr数据库注释的新基因数量最多(1077个),而被COG数据库注释的新基因数量最少(416个)。基于Q-value<0.05且Fold Change>2的筛选条件,共获得1408个差异表达基因(661个为显著上调表达基因,747个为显著下调表达基因);1408个差异表达基因被注释到53个GO功能条目中,其中,22条被注释到生物学过程(Biological process),16条被注释到细胞组分(Cellular component),15条被注释到分子功能(Molecular function);KEGG信号通路富集分析发现3条重要的信号通路,分别是溶酶体通路(Lysosome)、氨基糖和核苷酸糖新陈代谢(Amino sugar and nucleotide sugar metabolism)及鞘脂类代谢(Sphingolipid metabolism)。在溶酶体通路中,CTSL基因、Nramp基因、MyoG基因和Myf5基因在凡纳滨对虾快速生长群体肌肉组织中呈上调表达,而Trypsin基因呈下调表达。【结论】通过转录组测序分析从快速生长群体和慢速生长群体的凡纳滨对虾肌肉组织中筛选出1408个差异表达基因(661个为显著上调表达基因,747个为显著下调表达基因),主要富集在溶酶体、氨基糖和核苷酸糖新陈代谢及鞘脂类代谢等通路上,在对虾肌肉生长发育过程中发挥重要作用。  相似文献   

5.
香榧具有重要的经济价值,但其基因组信息相对匮乏,限制了其分子生物学和基因功能的研究。本文以不同组织的香榧作为研究对象,采用新一代高通量测序技术平台Illumina Hi Seq?2000对香榧转录组进行测序和数据分析,共得到37,349,086个reads片段,总碱基数为4.35 G。利用组装软件,对获得的高质量序列进行组装,共得到104,636个Unigene,平均长度为784 nt,N50为1,702。将Unigene序列与公共数据库进行比对,28,766个Unigenes获得了注释。其中26,856个Unigene在NR蛋白数据库中获得注释,24,003个Unigenes在NT数据库中获得注释,21,401个Unigene在Swiss-Prot蛋白数据库中获得注释,16,137个Unigene在COG数据库中获得注释,11,410个Unigene在GO数据库中获得注释。根据KEGG注释信息,18,564个Unigene被划分到256个代谢途径中。SSR位点搜索发现,在4,217个Unigene中含有4,706个SSR位点。分析所获得的转录组数据,将为香榧功能基因的克隆,基因的表达,指纹图谱构建和分子标记辅助选育奠定基础。  相似文献   

6.
[目的]利用高通量测序技术解析红脚艾(Artemisia rubripes Nakai)的转录组信息特征.[方法]通过高通量测序平台Illumina HiSeq 2500对红脚艾进行转录组测序,通过Trinity软件de novo组装获得Unigene,并基于序列同源性对Unigene进行功能注释,得到红脚艾的转录组信息.[结果]测序数据经过质控后共获得24126043条高质量的reads,通过de novo组装获得173093个转录本,对组装的转录本去冗余后共获得85991个Unigene,平均长度为616.87 bp,N50为925 bp.共有47216个Unigene在NR、KEGG、COG、KOG、GO数据库获得功能注释,40802个Unigene在NR数据库注释,显示红脚艾与向日葵(Helianthus annuus)的单基因匹配率最高,16846个Unigene被KEGG数据库注释到130条代谢途径中,26171个Unigene被注释到25个KOG功能分类中,23203个Unigene被GO注释到生物过程、细胞组成和分子功能三大类51个功能分类,12810个Unigene被注释到25个COG功能分类中.[结论]利用高通量测序技术获得了红脚艾转录组信息特征,这些数据将为后期开展功能基因鉴定、解析化合物次生代谢途径及其调控机制奠定研究基础.  相似文献   

7.
8.
[目的]分析藤茶高通量转录组序列,从中挖掘出黄酮类化合物合成相关基因,为进一步揭示藤茶黄酮类化合物生物合成调控机制提供理论参考.[方法]分别采集藤茶的幼叶和成熟叶,提取其总RNA构建cDNA文库,采用Il-lumina HiSeqTM 4000高通量测序平台对藤茶叶片进行转录组测序,经过滤处理后运用Trinity组装,将获得的Unigene与Nr、Nt、Pfam、Swiss-Prot、GO、KO和KOG 7个数据库进行比对注释,并预测Unigenes的编码区序列(CDS);基于KEGG信号通路富集分析,发掘藤茶黄酮类化合物合成相关基因.[结果]藤茶叶片转录组测序获得82126236条原始测序序列(Raw reads),过滤处理后得到80156972条高质量序列(Clean reads),进一步组装拼接得到92472条Unige-nes,平均长度为1208 bp,N50长度为1780 bp,其中,至少在1个数据库注释的Unigenes有84217条,占Unigenes总数的91.07%,有8944条Unigenes在7个数据库均被注释,占Unigenes总数的9.67%.在GO数据库成功注释的41116条Unige-nes可分为生物学过程、细胞组分和分子功能三大类,共56个小类;在KOG数据库注释的14553条Unigenes可分成25类,其中,一般功能预测注释成功的Unigenes最多(1946条);其次是翻译后修饰、蛋白质翻转、分子伴侣(1776条),参与次生代谢物质的生物合成、转运和降解的Unigenes较少,仅有319条;KEGG信号通路富集分析发现,共有15262条Unigenes注释到128条KEGG信号通路,以注释为代谢的Unigenes最多,为8694条,其中筛选获得有98个黄酮类化合物合成相关基因,分别编码苯丙烷代谢通路的3种关键酶和类黄酮代谢通路的14种关键酶.藤茶叶片转录组Unigenes与Swiss-Prot和Nr数据库比对,获得52582条CDS序列,ESTScan 3.0.3预测获得35535条CDS序列.[结论]藤茶在细胞过程、代谢过程、单有机体过程、细胞和细胞部分、结合和催化活性能力分布的基因较丰富,在一般功能、翻译、翻译后修饰、蛋白质翻转及分子伴侣的基因表达量较高,具有较强的碳水化合物代谢能力.多种关键酶基因参与藤茶黄酮类化合物的生物合成,推测其生物合成途径存在多条分支,调控机制也较复杂.  相似文献   

9.
【目的】获得冬瓜转录组序列、遗传变异等信息,从中挖掘冬瓜基因数据及SSR分子标记,为冬瓜后续研究提供数据支撑。【方法】以冬瓜嫩叶为材料,利用Illumina HiSeq~(TM)2000技术对冬瓜进行转录组测序,构建数据库从中获得干净序列。经De novo拼接组装后,将获得的单基因簇(Unigene)数据在非冗余蛋白数据库(nonredundant protein database,Nr)、蛋白质序列数据库(Swiss Prot protein database,Swiss Prot)、基因本体论数据库(gene ontology,GO)、蛋白质真核同源数据库(eukaryotic orthologous groups,KOG)、东京基因与基金组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)、蛋白质家族域数据库(protein families database,Pfam)6个公共数据库中进行比对,最终得到冬瓜单基因簇注释信息。利用MISA软件对转录组单基因簇进行搜索,获得单基因簇中的SSR位点。【结果】从冬瓜嫩叶中得到62 021 032条高品质序列,组装后获得40 611条单基因簇,平均长度955 bp。将所有单基因簇在Nr和Swiss Prot数据库中进行比对,结果分别比对到27 474及19 573条单基因簇;在GO数据库中,所注释到的10 659条单基因簇分别匹配到生物功能、分子功能和细胞组分3个本体的47个功能组中;与KOG数据库进行注释比对,根据其功能将注释到的单基因簇划分为25类;KEGG数据库比对注释到10 799条冬瓜的单基因簇,可分为5个大类、19个亚类、125条代谢途径;在Pfam数据库中比对到17 990条单基因簇,分属于369个类群。SSR位点搜索发现,有5 086条单基因簇包含SSR序列,获得5 474个SSR位点。【结论】利用高通量测序获得大量冬瓜转录组信息,有助于从分子水平对冬瓜进行深入研究。  相似文献   

10.
[目的]从转录水平分析牛心朴子在低温胁迫下的差异表达基因,筛选响应低温胁迫的转录因子家族,鉴定出牛心朴子低温胁迫响应的关键调控基因,为全面解析逆境胁迫响应分子调控网络及有效挖掘关键调控基因提供理论参考.[方法]通过高通量测序技术对低温胁迫(CT组)和常温处理(对照,CK组)的牛心朴子cDNA文库进行转录组测序分析,对差异表达基因进行功能注释和富集,鉴定出响应低温胁迫的转录因子家族,并选取4个差异表达的转录因子基因进行实时荧光定量PCR检测,以验证转录组测序结果的可信度.[结果]从CK组和CT组共获得30.50 Gb的原始数据,Cycle Q20平均值在96%以上,经数据过滤及去冗余后,拼接组装获得100006条Unigenes,但其功能注释率较低,有47082条至少在一个数据库中被功能注释,占Unigenes总数的47.07%;而在NR、NT、KO、SwissProt、PFAM、GO和KOG数据库中均被注释的Unigene有7070条,仅占Unigenes总数的7.06%.GO功能富集分析筛选到5545个差异表达基因,其中,上调表达基因2039个,下调表达基因3506个,分别富集到生物过程、细胞组分和分子功能三大类别中.从牛心朴子Unigene中共鉴定到83个转录因子家族的1826个转录因子,其中,以MYB转录因子家族成员数目最多,为136个(占7.45%).从差异表达基因中筛选到与低温胁迫有关的66个转录因子家族的550个转录因子,其中MYB、C3H、bHLH、AP2-EREBP、C2H2、NAC、bZIP、CCAAT和WRKY等转录因子家族均有大量转录因子能被低温胁迫诱导表达.基于实时荧光定量PCR的牛心朴子低温胁迫下转录因子基因表达水平检测结果与转录组测序分析结果基本一致.[结论]MYB、C3H、bHLH、AP2-EREBP、C2H2、NAC、bZIP、CCAAT和WRKY等转录因子家族成员在牛心朴子响应低温胁迫时发挥主导作用,同时各家族转录因子间存在共表达性或协同作用,通过复杂的转录调控网络发挥重要调节作用,进而提高牛心朴子对低温胁迫的耐受性.  相似文献   

11.
【目的】探究脊尾白虾(Exopalaemon carinicauda)鳃组织在渐变式低氧—复氧胁迫下的分子调控机制,为今后开展脊尾白虾耐低氧品系(种)的选育提供理论指导。【方法】通过模拟自然低氧环境的形成过程,分别于低氧处理0(对照)、3和6 h及复氧后1和8 h采集脊尾白虾鳃组织,利用Illumina HiSeqTM 4000测序平台进行转录组测序分析,经过滤和Trinity组装获得Unigenes,选取Nr、Swiss-Prot、KEGG和COG/KOG等数据库进行注释分析,在Omicsmart平台上完成差异表达基因筛选及其表达趋势分析,然后进行GO功能注释分析和KEGG信号通路富集分析,并随机选取5个差异表达基因进行实时荧光定量PCR验证。【结果】脊尾白虾鳃组织样本转录组测序数据经过滤后的Cleanreads进行Trinity组装共获得93227条Unigenes,其长度范围在201~35402 bp,平均长度为834 bp,N50长度为1352 bp。通过组间两两比较分析,共鉴定出4750个差异表达基因,其中上调差异表达基因3557个、下调差异表达基因2829个;超过50%的差异表达基因被显著富集到6种基因表达趋势模式中(P<0.01),具体表现为:Profile 0模式富集到415个基因,Profile 5模式富集到201个基因,Profile 11模式富集到371个基因,Profile 13模式富集到841个基因,Profile 17模式富集到387个基因,Profile 18模式富集到411个基因。6种基因表达趋势模式中的差异表达基因被注释到代谢进程、细胞进程、单一有机体进程、细胞、细胞零件、大分子复合物及催化活性等GO功能条目上;而KEGG信号通路富集分析结果显示,以Profile 13模式中的差异表达基因富集到最多信号通路(86条),其中呈显著富集的有8条,分别为核糖体、碳代谢、氧化磷酸化、氨基酸生物合成、内质网蛋白质加工、糖酵解/糖异生、谷胱甘肽代谢和蛋白输出。【结论】脊尾白虾鳃组织在受低氧胁迫早期通过合成蛋白质及提高代谢能力来抵御低氧环境,随着低氧胁迫时间的延长,物质合成和能量代谢活动均显著下降;但在复氧后随着复氧时间的延长,其蛋白质合成和能量代谢水平又逐渐升高恢复至常氧水平。  相似文献   

12.
【目的】 研究福清山羊与努比亚黑山羊发情期卵巢组织转录组差异表达水平,一方面为山羊繁殖性状形成的分子机制提供理论依据,另一方面为利用努比亚黑山羊杂交改良福清山羊提供可加快遗传进展的分子标记。【方法】 利用转录组测序方法对福清山羊和努比亚黑山羊发情期卵巢组织进行研究,筛选品种间的差异表达基因(differentially expressed genes,DEGs),并对DEGs功能进行注释和若干基因荧光定量PCR(quantitative real-time PCR,qRT-PCR)验证;同时通过与参考基因组比对,分析和筛选测序样品中存在的SNP/InDel。【结果】 6个样品共得到46.68Gb Clean Data,DESeq分析发现了福清山羊和努比亚黑山羊发情期卵巢组织的DEGs149个(包含25个新转录本),其中表达上调53个,表达下调96个;初步认为输卵管素基因(oviductin,OVN)、类固醇合成快速调节蛋白基因(steroidogenic acute regulatory protein,STAR)、早期生长应答1基因(early growth response 1,EGR1)可作为福清山羊繁殖性能的候选基因。149个DEGs中的108个基因能被GO(gene ontology)数据库注释,30个DEGs能够被COG(Cluster of Orthologous Groups of proteins)数据库注释,91个DEGs能够被KEGG(kyoto encyclopediaof genes and genomes)数据库注释。KEGG通路分析表明DEGs共富集到21条信号通路中,6条通路显著富集。经过进一步的与参考基因组序列比对分析,共发掘1 506个新转录本。经qRT-PCR验证,所选基因(转录本)表达变化模式与转录组测序结果一致,表明测序结果可靠。【结论】 在转录组水平上筛选出了福清山羊和努比亚黑山羊发情期卵巢组织的149个DEGs,发掘了1 506个新转录本,初步揭示了OVNSTAREGR1在山羊繁殖过程中可能发挥重要作用,为进一步探索山羊繁殖性状相关机理提供参考依据。  相似文献   

13.
14.
【目的】对盐胁迫下海马齿根系进行转录组测序分析,挖掘海马齿根系耐盐相关基因,为揭示海马齿耐盐的分子机制提供参考。【方法】利用Illumina测序技术对0 mmol/L NaCl (对照组)和400 mmol/L NaCl胁迫处理(盐胁迫处理组)下的海马齿根系进行转录组测序分析,从中筛选出差异表达基因,选取13个基因进行实时荧光定量PCR (qRTPCR)检测,以验证转录组数据的可靠性。【结果】在海马齿根系转录组中共鉴定出305145个转录本,平均长度为622 bp,其中,对照组有146177个长度>300 bp的转录本,盐胁迫处理组有72173个长度>300 bp的转录本;共有65535条Unigenes在Nr、GO、Swiss-Prot、COG和KEGG五大数据库注释成功,占Unigenes总数的52.36%。对照组和盐胁迫处理组共有65535个差异Unigenes,其中,有182个热休克蛋白基因。对照组和盐胁迫处理组间共有24042个差异表达基因,从中选取13个基因进行qRT-PCR检测,结果显示,9个基因表达上调,其余4个基因表达下调,与转录组测序结果一致。24042个差异表达基因中,共有10106个显著差异基因富集到129条代谢通路,其中富集程度排名前10的代谢途径为核糖体、次级代谢生物合成、RNA转运、内吞作用、剪接体、甘油磷脂代谢、内质网加工、吞噬、醚脂类代谢和植物-病原体相互作用,参与盐胁迫相关的硫代谢、脯氨酸积累、活性氧(ROS)代谢、与盐胁迫相关的钙信号通路和过氧化氢代谢等途径的差异基因上调。【结论】在盐胁迫下海马齿差异表达基因如小分子量热激蛋白基因、抗氧化酶相关基因及与离子交换相关基因发挥了重要调控作用。  相似文献   

15.
【目的】利用第三代纳米孔(nanopore)长读段测序技术对蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)的纯化菌丝(Aam)和孢子(Aas)进行测序,构建和注释球囊菌的高质量全长转录组。【方法】通过Oxford Nanopore PromethION平台对Aam和Aas进行测序。利用Guppy软件对原始读段(raw reads)进行碱基识别(base calling),通过过滤短片段和低质量原始读段得到有效读段(clean reads)。通过识别两端引物鉴定全长转录本序列。通过比对Nr、Swissprot、KOG、eggNOG、Pfam、GO和KEGG数据库获得全长转录本的注释信息。分别利用CPC、CNCI、CPAT、Pfam 4种方法对长链非编码RNA(long non-coding RNA,lncRNA)进行预测,取四者的交集作为高可信度的lncRNA。【结果】Aam和Aas的纳米孔测序分别测得6 321 704和6 259 727条原始读段,经质控得到5 669 436和6 233 159条有效读段,其中包含的全长有效读段分别为4 497 102(79.32%)和4 963 101(79.62%)条。共鉴定到9 859和16 795条非冗余全长转录本,N50分别为1 482和1 658 bp,平均长度分别为1 187和1 303 bp,最大长度分别为6 472和6 815 bp。Venn分析结果显示有6 512条非冗余全长转录本为菌丝和孢子所共有,分别有3 347和10 283个非冗余全长转录本为二者特有。此外,在球囊菌菌丝和孢子中共鉴定到20 142条全长转录本,其中分别有20 809、11 151、17 723、12 164、11 340和9 833条全长转录本可注释到Nr、KOG、eggNOG、Pfam、GO和KEGG数据库。注释全长转录本数量最多的物种是球囊菌、Polytolypa hystricis和荚膜组织胞浆菌(Histoplasma capsulatum)。GO数据库注释结果显示,上述全长转录本可注释到45个功能条目,涉及细胞组件、细胞和细胞器等细胞组分相关条目;催化活性、结合和转运器活性等分子功能相关条目;以及细胞进程、代谢进程和单一组织进程等生物学进程相关条目。KEGG数据库注释结果显示,上述全长转录本还可注释到抗生素的生物合成、核糖体、氨基酸的生物合成、碳代谢和剪接体等49条通路。此外,鉴定到648条高可信度的lncRNA,包含480条基因间区lncRNA、119条反义链lncRNA和49条正义链lncRNA。【结论】构建和注释了球囊菌的首个高质量全长转录组,为探究球囊菌转录组的复杂性,完善参考基因组的序列和功能注释信息以及深入开展球囊菌可变剪接体的功能研究提供了关键依据。  相似文献   

16.
【目的】探明贵紫麦1号小麦灌浆期变紫后和变紫前2个时期籽粒的转录组差异,发掘影响贵紫麦1号花青素合成的关键基因和关键酶,丰富小麦籽粒色素转录组数据信息,为转录因子的克隆及表达提供参考。【方法】利用Illumina Hiseq 2000TM高通量测序技术对贵紫麦1号籽粒变紫前和变紫后2个时期进行转录组测序、文库构建及建库质量评估,对测序结果进行信息学分析。采用TTM对read count数据进行标准化处理,随后用DEGseq进行差异分析,设定q-value<0.005且|log2 (fold change)|>1为阈值。通过筛选分析,获得两者间差异表达基因,按照无参转录组分析方法,对差异表达基因进行BLAST搜索,Nr数据库比对,GO功能富集及KEGG pathway分析,找出与花青素相关的关键基因和关键酶,并结合qRT-PCR验证所找到的关键基因及关键酶在不同时期的表达水平,掌握这些关键基因的信息。【结果】测序结果表明,贵紫麦1号变紫后和变紫前分别获得13.36 G和12.69 G的clean bases,clean reads为106 906 108条和101 547 534条,占原始序列的93.73%和94.90%。通过Trinity软件对所得clean reads进行拼接,共获得170 396条转录本,长度为119 020 625。拼接clean reads后获得119 572条Unigenes。在BLAST搜索中,119 572个高质量独特序列中有86 004条(71.92%)Unigenes与现有基因模型具有至少1个显著匹配。在Nr数据库比对结果鉴定了至少5种具有与来自节节麦、乌拉尔图小麦、二穗短柄草、大麦、小麦等已知基因同一性且序列相似性高的Unigenes。KOG数据库比对结果显示,注释成功的基因按KOG的26个group进行分类,注释在一般功能基因,蛋白质翻译后修饰与转运、分子伴侣及翻译、核糖体结构与生物合成等类别基因所占比重较大,分别为15.79%、14.51%和10.54%。643个差异基因中,236个呈上调趋势,407个呈下调趋势。GO注释表明,按照基因参与的生物过程、所处的细胞组分、具有的分子功能下一层级分类,共44个分类,差异基因显著富集在碳水化合物代谢过程(GO:0005975,16.03%)、应激反应(GO:0006950,10.83%)和水解酶活性分子功能(GO:0016787,34.84%)等类别中。KEGG pathway富集分析可知,353个差异基因富集到153条相关通路上,其中淀粉与蔗糖代谢、苯丙素生物合成、类黄酮生物合成等通路富集显著。类黄酮生物合成途径相关基因共66个,2条相关上调表达Unigenes,涉及查尔酮酶、隐色花色素双加氧酶2个关键酶基因,log2(fold change)分别为3.4164和2.1258。对所得关键基因进行qRT-PCR验证,证实查尔酮酶、隐色花色素双加氧酶在贵紫麦中1号中表达量呈明显上调趋势,与转录组测序分析结果一致,测序结果可靠度高。【结论】比较分析贵紫麦1号籽粒变紫后和变紫前2个时期转录组测序结果,获得大量Unigenes数据及差异表达基因相关信息,明确类黄酮代谢途径中2个关键酶基因(CHS和ANS)在调控贵紫麦1号籽粒花青素合成过程中作用显著。  相似文献   

17.
【目的】利用RNA seq技术对中华蜜蜂(Apis cerana cerana,简称中蜂)幼虫肠道参考转录组进行de novo组装,并进行功能及代谢通路注释,进而利用该转录组数据进行中蜂幼虫的SSR分子标记鉴定。【方法】实验室条件下饲养中蜂幼虫,将纯化的蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)孢子饲喂3日龄幼虫,剖取4、5和6日龄幼虫肠道,液氮速冻。将健康幼虫肠道与感染球囊菌的幼虫肠道同时进行Illumina测序。通过对raw reads的过滤得到clean reads,利用Trinity软件组装得到unigenes。通过BLASTx(E-value10-5)比对NCBI Nr、Swiss-Prot、KOG和KEGG数据库,对unigenes进行功能和代谢通路注释。利用MISA软件对所有unigenes进行SSR搜索,并利用Primer Premier 5软件设计特异性SSR引物,通过常规PCR对来源于北京、辽宁兴城和四川成都的中蜂幼虫肠道样本进行SSR位点鉴定。【结果】中蜂幼虫肠道的RNA seq共得到35 670 000条reads,de novo组装得到43 557个unigenes,平均长度为898 nt。共有18 225个unigenes可被注释到上述公共蛋白数据库,单独注释到NCBI Nr、Swiss-Prot、KOG和KEGG数据库的unigenes数分别为3 899、443、37和10个。KOG注释结果显示,11 442条unigenes分布于25个基因家族,其中注释到RNA加工和修饰家族的基因数最多,达1 249个。9 679个unigenes的GO分类结果显示,在生物学进程分类中,注释到细胞进程的基因最多,达4 201个,在分子功能和细胞组分类中,注释到结合与细胞的基因数最多,分别为4 935和2 900个。4 517个unigenes可注释到KEGG数据库中的216个代谢通路,注释到核糖体的基因数最多,达385个。利用MISA软件,可在7 763个unigenes搜索到13 448个SSR位点,随机选取20对SSR引物对国内3个不同来源的中蜂幼虫肠道样本的SSR位点进行扩增,有6对引物可鉴定出SSR分子标记。【结论】成功组装并注释了中蜂幼虫肠道参考转录组,可为中蜂及其幼虫的分子生物学及组学研究提供重要的参考信息,也可用于补充、丰富和检验东方蜜蜂的参考基因组,基于此转录组数据开发出6个中蜂的SSR分子标记,可应用于中蜂的基因图谱构建、基因多样性分析、基因定位等研究,也说明利用转录组数据开发非模式生物SSRs的方法可行。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号