首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 343 毫秒
1.
[目的]分析藤茶高通量转录组序列,从中挖掘出黄酮类化合物合成相关基因,为进一步揭示藤茶黄酮类化合物生物合成调控机制提供理论参考.[方法]分别采集藤茶的幼叶和成熟叶,提取其总RNA构建cDNA文库,采用Il-lumina HiSeqTM 4000高通量测序平台对藤茶叶片进行转录组测序,经过滤处理后运用Trinity组装,将获得的Unigene与Nr、Nt、Pfam、Swiss-Prot、GO、KO和KOG 7个数据库进行比对注释,并预测Unigenes的编码区序列(CDS);基于KEGG信号通路富集分析,发掘藤茶黄酮类化合物合成相关基因.[结果]藤茶叶片转录组测序获得82126236条原始测序序列(Raw reads),过滤处理后得到80156972条高质量序列(Clean reads),进一步组装拼接得到92472条Unige-nes,平均长度为1208 bp,N50长度为1780 bp,其中,至少在1个数据库注释的Unigenes有84217条,占Unigenes总数的91.07%,有8944条Unigenes在7个数据库均被注释,占Unigenes总数的9.67%.在GO数据库成功注释的41116条Unige-nes可分为生物学过程、细胞组分和分子功能三大类,共56个小类;在KOG数据库注释的14553条Unigenes可分成25类,其中,一般功能预测注释成功的Unigenes最多(1946条);其次是翻译后修饰、蛋白质翻转、分子伴侣(1776条),参与次生代谢物质的生物合成、转运和降解的Unigenes较少,仅有319条;KEGG信号通路富集分析发现,共有15262条Unigenes注释到128条KEGG信号通路,以注释为代谢的Unigenes最多,为8694条,其中筛选获得有98个黄酮类化合物合成相关基因,分别编码苯丙烷代谢通路的3种关键酶和类黄酮代谢通路的14种关键酶.藤茶叶片转录组Unigenes与Swiss-Prot和Nr数据库比对,获得52582条CDS序列,ESTScan 3.0.3预测获得35535条CDS序列.[结论]藤茶在细胞过程、代谢过程、单有机体过程、细胞和细胞部分、结合和催化活性能力分布的基因较丰富,在一般功能、翻译、翻译后修饰、蛋白质翻转及分子伴侣的基因表达量较高,具有较强的碳水化合物代谢能力.多种关键酶基因参与藤茶黄酮类化合物的生物合成,推测其生物合成途径存在多条分支,调控机制也较复杂.  相似文献   

2.
【目的】对青花菜花蕾进行转录组测序分析,并挖掘与蜡粉合成相关基因,为探明青花菜花球表面蜡粉形成的分子机制提供理论参考。【方法】分别提取野生型和蜡粉缺失型青花菜花球总RNA,采用Illumina HiSeqTM 2500平台进行转录组测序,获得高质量Clean reads,采用Trinity进行序列组装后获得青花菜Unigene库,将获得的Unigene序列与Nr、Nt、KEGG、Pfam、KOG/COG、Swiss-Prot和GO数据库比对,获得基因功能注释信息;使用DESeq2进行差异表达分析。【结果】共获得44.68 Gb Clean data,De novo组装得到41244条Unigenes,N50长度为1847 bp。从所获得的Unigenes中筛选出8685个差异表达基因(DEGs)(上调基因5747个,下调基因2938个),共有8038个基因被注释到不同数据库,其中,5220个基因注释到Pfam数据库; 2066个基因注释到COG数据库,3866个基因注释到KOG数据库; 2580个差异表达基因被注释到75个转录因子家族中,注释最多的是MYB家族(235个);GO数据库中6095个差异表达基因注释到细胞组分、分子功能和生物学过程三大类的52个功能分类; KEGG数据库中,1671个差异表达基因富集到138条代谢通路,其中13个差异表达基因与脂肪酸合成有关,7个差异表达基因与蜡粉生物合成途径有关。【结论】转录因子MYB家族在调控青花菜蜡粉合成中发挥重要作用。蜡粉合成过程中相关酶基因的差异表达是调控青花菜蜡粉合成的关键,尤其是野生型和蜡粉缺失突变体中特异性表达的差异表达基因,可作为后续研究青花菜花球表面蜡粉形成分子机制的对象。  相似文献   

3.
为进一步开发大竹蛏Solen grandis的基因资源,采用2代Illumina Hi-seq测序技术对大竹蛏的鳃组织进行了转录组测序,构建了转录组数据库,获得338 483 476条Clean Reads数据;拼接组装后获得190 856条Unigene数据,平均长度为1147 bp;与NR、NT、KO、Swiss Prot、PFAM、GO、KOG等数据库进行Blast信息比对(E-value为10-5),共获得63 337个注释基因;与NR数据库比对发现,大竹蛏转录组基因序列与长牡蛎Crassostrea gigas具有较高的同源性,为53.3%;将大竹蛏转录组的Unigene的功能通过与KOG数据库进行注释比对划分为25类;GO数据库注释可分为三类,即细胞组分、生物过程和分子功能,共包括65个分支;KEGG分析发现,大竹蛏转录组数据中按照代谢通路可分为92类,利用Blast蛋白库比对和Estscan软件进行ORF预测,获得长度大于300 nt的ORF共50 681个;通过SSR分析,共获得73 089个SSR标记。本研究中获得的转录组信息可为今后进行大竹蛏分子标记的开发和关键基因的克隆及功能分析等研究提供基础数据。  相似文献   

4.
【目的】鉴定筛选出与卵形鲳鲹卵巢发育相关的候选基因及信号通路,为揭示其卵巢性成熟过程的分子机制打下基础。【方法】挑选卵巢发育处于?期和Ш期的雌性卵形鲳鲹,分别构建卵形鲳鲹卵巢?期和Ш期的cDNA文库,采用Illumina HiSeqTM 2500进行转录组测序,经过滤、质量控制及拼接组装后获得的Unigenes在七大数据库(Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO)中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行功能注释及信号通路富集分析,并采用MISA和GATK3进行SSR鉴定及SNP分析。【结果】卵形鲳鲹卵巢组织转录组测序获得的325156432条Raw reads,经过滤筛选得到317206752条Clean reads,拼接组装后得到59554条Unigenes;69.65%的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等七大数据库中注释成功,其中有24599条Unigenes被注释到GO数据库,15997条Unigenes被注释到KEGG数据库。在卵形鲳鲹卵巢组织的2个发育时期共鉴定获得56115个基因,经差异表达分析后获得17737个差异基因,其中8169个基因在卵巢Ш期上调表达、9568个基因在卵巢Ш期下调表达。GO功能注释分析发现,卵形鲳鲹卵巢差异表达基因主要注释在细胞过程、氮化合物代谢过程、初级代谢过程、核、核部分、离子结合及水解酶活性等条目上;而KEGG信号通路富集分析结果显示,17737个差异表达基因显著富集在318条代谢途径上,其中前20条KEGG信号通路包括2-氧代羧酸代谢、PI3K-Akt信号通路、甲状腺激素信号通路、磷脂酶D信号通路、Fc εRI信号通路和细胞周期等。卵形鲳鲹卵巢转录组(59554条Unigenes)中共存在30133个SSRs和82490个SNPs。【结论】GnRHR、FSHR、FSHβ、CYP11A、SIRT3和PEG3等差异表达基因及PI3K-Akt信号通路和VEGF信号通路等与卵形鲳鲹卵巢的发育密切相关,共同调节卵巢的发育与成熟,在卵巢性成熟过程中发挥重要作用。  相似文献   

5.
[目的]利用高通量测序技术解析红脚艾(Artemisia rubripes Nakai)的转录组信息特征.[方法]通过高通量测序平台Illumina HiSeq 2500对红脚艾进行转录组测序,通过Trinity软件de novo组装获得Unigene,并基于序列同源性对Unigene进行功能注释,得到红脚艾的转录组信息.[结果]测序数据经过质控后共获得24126043条高质量的reads,通过de novo组装获得173093个转录本,对组装的转录本去冗余后共获得85991个Unigene,平均长度为616.87 bp,N50为925 bp.共有47216个Unigene在NR、KEGG、COG、KOG、GO数据库获得功能注释,40802个Unigene在NR数据库注释,显示红脚艾与向日葵(Helianthus annuus)的单基因匹配率最高,16846个Unigene被KEGG数据库注释到130条代谢途径中,26171个Unigene被注释到25个KOG功能分类中,23203个Unigene被GO注释到生物过程、细胞组成和分子功能三大类51个功能分类,12810个Unigene被注释到25个COG功能分类中.[结论]利用高通量测序技术获得了红脚艾转录组信息特征,这些数据将为后期开展功能基因鉴定、解析化合物次生代谢途径及其调控机制奠定研究基础.  相似文献   

6.
【目的】获得冬瓜转录组序列、遗传变异等信息,从中挖掘冬瓜基因数据及SSR分子标记,为冬瓜后续研究提供数据支撑。【方法】以冬瓜嫩叶为材料,利用Illumina HiSeq~(TM)2000技术对冬瓜进行转录组测序,构建数据库从中获得干净序列。经De novo拼接组装后,将获得的单基因簇(Unigene)数据在非冗余蛋白数据库(nonredundant protein database,Nr)、蛋白质序列数据库(Swiss Prot protein database,Swiss Prot)、基因本体论数据库(gene ontology,GO)、蛋白质真核同源数据库(eukaryotic orthologous groups,KOG)、东京基因与基金组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)、蛋白质家族域数据库(protein families database,Pfam)6个公共数据库中进行比对,最终得到冬瓜单基因簇注释信息。利用MISA软件对转录组单基因簇进行搜索,获得单基因簇中的SSR位点。【结果】从冬瓜嫩叶中得到62 021 032条高品质序列,组装后获得40 611条单基因簇,平均长度955 bp。将所有单基因簇在Nr和Swiss Prot数据库中进行比对,结果分别比对到27 474及19 573条单基因簇;在GO数据库中,所注释到的10 659条单基因簇分别匹配到生物功能、分子功能和细胞组分3个本体的47个功能组中;与KOG数据库进行注释比对,根据其功能将注释到的单基因簇划分为25类;KEGG数据库比对注释到10 799条冬瓜的单基因簇,可分为5个大类、19个亚类、125条代谢途径;在Pfam数据库中比对到17 990条单基因簇,分属于369个类群。SSR位点搜索发现,有5 086条单基因簇包含SSR序列,获得5 474个SSR位点。【结论】利用高通量测序获得大量冬瓜转录组信息,有助于从分子水平对冬瓜进行深入研究。  相似文献   

7.
为获取入侵性检疫害虫椰子织蛾的基因信息,利用高通量测序技术对该害虫进行了转录组测序。结果表明:经拼接共获得了37 416条unigenes,平均长度为803 bp,N50为1 415 bp;通过BlastX比对,有19 154条unigenes (51.19%)成功在Nr中被注释。在Nr中成功注释的unigene,与黑脉金斑蝶同源性最高,达到68.45%;在GO注释中,共有14 131 (37.76%)条unigenes被成功注释到细胞组分、分子功能和生物过程3大类的54个分支;在COG数据库中,成功注释的8 606条unigenes被注释到26个分类;在KEGG中,共有6 171条(16.49%) unigenes被注释到5大类通路的260条途径上。基于构建的转录组数据库,鉴定得到3 248个微卫星。  相似文献   

8.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

9.
【目的】探明贵紫麦1号小麦灌浆期变紫后和变紫前2个时期籽粒的转录组差异,发掘影响贵紫麦1号花青素合成的关键基因和关键酶,丰富小麦籽粒色素转录组数据信息,为转录因子的克隆及表达提供参考。【方法】利用Illumina Hiseq 2000TM高通量测序技术对贵紫麦1号籽粒变紫前和变紫后2个时期进行转录组测序、文库构建及建库质量评估,对测序结果进行信息学分析。采用TTM对read count数据进行标准化处理,随后用DEGseq进行差异分析,设定q-value<0.005且|log2 (fold change)|>1为阈值。通过筛选分析,获得两者间差异表达基因,按照无参转录组分析方法,对差异表达基因进行BLAST搜索,Nr数据库比对,GO功能富集及KEGG pathway分析,找出与花青素相关的关键基因和关键酶,并结合qRT-PCR验证所找到的关键基因及关键酶在不同时期的表达水平,掌握这些关键基因的信息。【结果】测序结果表明,贵紫麦1号变紫后和变紫前分别获得13.36 G和12.69 G的clean bases,clean reads为106 906 108条和101 547 534条,占原始序列的93.73%和94.90%。通过Trinity软件对所得clean reads进行拼接,共获得170 396条转录本,长度为119 020 625。拼接clean reads后获得119 572条Unigenes。在BLAST搜索中,119 572个高质量独特序列中有86 004条(71.92%)Unigenes与现有基因模型具有至少1个显著匹配。在Nr数据库比对结果鉴定了至少5种具有与来自节节麦、乌拉尔图小麦、二穗短柄草、大麦、小麦等已知基因同一性且序列相似性高的Unigenes。KOG数据库比对结果显示,注释成功的基因按KOG的26个group进行分类,注释在一般功能基因,蛋白质翻译后修饰与转运、分子伴侣及翻译、核糖体结构与生物合成等类别基因所占比重较大,分别为15.79%、14.51%和10.54%。643个差异基因中,236个呈上调趋势,407个呈下调趋势。GO注释表明,按照基因参与的生物过程、所处的细胞组分、具有的分子功能下一层级分类,共44个分类,差异基因显著富集在碳水化合物代谢过程(GO:0005975,16.03%)、应激反应(GO:0006950,10.83%)和水解酶活性分子功能(GO:0016787,34.84%)等类别中。KEGG pathway富集分析可知,353个差异基因富集到153条相关通路上,其中淀粉与蔗糖代谢、苯丙素生物合成、类黄酮生物合成等通路富集显著。类黄酮生物合成途径相关基因共66个,2条相关上调表达Unigenes,涉及查尔酮酶、隐色花色素双加氧酶2个关键酶基因,log2(fold change)分别为3.4164和2.1258。对所得关键基因进行qRT-PCR验证,证实查尔酮酶、隐色花色素双加氧酶在贵紫麦中1号中表达量呈明显上调趋势,与转录组测序分析结果一致,测序结果可靠度高。【结论】比较分析贵紫麦1号籽粒变紫后和变紫前2个时期转录组测序结果,获得大量Unigenes数据及差异表达基因相关信息,明确类黄酮代谢途径中2个关键酶基因(CHS和ANS)在调控贵紫麦1号籽粒花青素合成过程中作用显著。  相似文献   

10.
为开展彩色马蹄莲基因功能分析、表型差异研究、分子标记开发和遗传多样性研究,通过Illumina HiSeq 4000高通量测序平台对2个彩色马蹄莲育成品种‘金丝绒’和‘梦幻’进行转录组测序分析,经de novo组装后获得76 060条unigene,进一步利用4个公共数据库(Nr、Swiss-Prot、KOG和KEGG)对其进行注释,注释了30 321条unigene;并基于转录组数据开展SSR位点预测和密码子使用偏好性分析。结果表明:有10 083个unigene参与了132条KEGG代谢通路,其中代谢途径和次生代谢产物的生物合成途径是unigene最为富集的2个途径; 9 721条unigene序列中共含有13 206个SSR位点;预测到1 115个转录因子,分属于54个家族。此外,彩色马蹄莲密码子使用偏好性较弱,高频密码子为AGG、CAG和AAG。  相似文献   

11.
运用高通量技术对杂交鳢进行转录本测序和数据分析,经拼接与组装,最终获得52 065条unigenes,长度范围201~12 407 bp,序列平均长度为710 bp。从长度分布、GC含量和基因表达量等方面对unigenes进行评估,数据显示测序质量较好。进一步的数据分析,共鉴定出20 535个CDS,37 324个SNP位点和7 830个微卫星。用6大数据库Swiss–Prot、Nr、Pfam、KEGG、KOG和GO注释杂交鳢转录组unigenes,分别对应有20 955、28 938、19 339、14 052、19 358和18 635条unigenes获得注释。根据GO数据库的注释,可将这些unigenes分为生物过程、细胞组分和分子功能3大类共50亚类。KEGG代谢通路分析表明,这些unigenes参与了5大类30亚类共268个代谢通路,其中,参与信号转导通路的unigenes数量最多,有1 716条。  相似文献   

12.
[目的]利用第三代纳米孔(nanopore)长读段测序技术对蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)的纯化菌丝(Aam)和孢子(Aas)进行测序,构建和注释球囊菌的高质量全长转录组.[方法]通过Oxford Nanopore PromethION平台对Aam和Aas进行测序.利用Guppy软件对原始读...  相似文献   

13.
采用RNA-Seq技术,对黄连根茎与须根进行转录组分析,经过trinity软件组装得到130 592条Unigenes,平均长度为700 bp,其中68 976条Unigenes在NR、GO、KEGG、eggNOG、Swiss-Prot和Pfam数据库获得基因注释信息,仅占全部Unigenes的52.82%。39 572个Unigene被注释到GO数据库的生物学进程、细胞组分和分子功能三大类的52个小类中;参与KEGG的5大类代谢通路,34个代谢路径,共搜索到24 999个SSR位点,单核苷酸、两核苷酸和三核苷酸为黄连根部SSR的主要重复基序。黄连根茎与须根的差异表达基因有13 496个,在黄连须根中上调的差异基因有8 375个,下调的有5 121个。两者差异基因GO富集分析表明,跟次生代谢相关进程的前5项为次生代谢进程、次生代谢物生物合成过程、生物碱代谢过程、异喹啉生物碱生物合成过程和异喹啉生物碱代谢过程。在细胞组分分类中,膜结构、细胞壁和外封装结构为差异基因富集的前三;在分子功能分类中,跟氧化还原酶活性相关条目占差异基因富集显著的前四。在KEGG数据库中,共有3 749个差异基因定位到125个代谢途径中,其中,24个差异基因注释到异喹啉生物碱生物合成,在关联的8条KEGG通路中,筛选得到11个关键酶基因;同时,有39个差异基因注释到络氨酸代谢途径中,在关联的21条KEGG通路中,筛选得到10种关键酶基因。黄连根部转录组数据的获得为研究黄连异喹啉类生物碱的合成及黄连根茎与须根代谢差异奠定了基础。  相似文献   

14.
粉葛是豆科葛属植物,其块根富含淀粉,具有重要的食用和药用价值。不同粉葛品种的淀粉含量存在明显差异。为揭示粉葛淀粉合成调控的相关基因,利用高通量测序技术,对2个淀粉含量存在显著差异的赣葛1号(高淀粉含量,鲜葛根含淀粉20%,干葛根含淀粉35%)和赣葛2号(低淀粉含量,鲜葛根含淀粉14%,干葛根含淀粉25%)的叶片进行转录组学测序和比较分析。结果表明,获得228 740 426条高质量测序数据,拼接组装成71 910条单基因,43 978条单基因获得蛋白序列而被注释(占61.12%),在Nr、KEGG、KOG和SwissProt四大数据库中均被注释的单基因有20 110条,其中差异表达基因4 267个。GO富集分析显示,上调和下调最多的基因富集在生物学过程中的新陈代谢和细胞过程功能中。KEGG代谢通路富集分析发现,通路显著富集在前位的是核糖体、蛋白质在内质网中的加工过程、氧化磷酸化、植物与病原体的相互作用和植物激素信号转导等。差异表达基因中,赣葛1号中的上调(2 143个)和下调(2 124个)基因相差不大,|log2(FC)|>5.0的表达上调(593个)和下...  相似文献   

15.
基于边合成边测序( Sequencing By Synthesis ,SBS)技术,使用Illumina HiSeq2500高通量测序平台对长白落叶松cDNA文库进行测序。共获得非重复序列基因58683条,总长度为55283938 bp。将得到的转录本使用BLAST软件将非重复序列基因序列与NR、Swiss-Prot、GO、COG、KEGG数据库比对,通过选择BLAST参数E-value不大于10-5,最终获得29350个有注释信息的基因序列,其中19292个转录本注释GO编号,有9112个转录本在COG数据库中被注释并分为25个功能分类,同时注释到120条KEGG代谢途径。在得到注释的转录本中搜索到木质素相关基因共68条,其中与木质素合成相关基因29条,与木质素分解代谢相关基因27条;找到了147条纤维素相关基因,其中与纤维素合成相关基因103条,与纤维素分解代谢相关基因44条。  相似文献   

16.
【目的】掌握不同生长规格墨瑞鳕个体间差异表达基因的表达特点,为其功能相关基因深度挖掘及分子遗传育种提供科学依据。【方法】挑选同一养殖条件下极大个体和极小个体的墨瑞鳕,构建肌肉组织cDNA文库后,采用Illumina HiSeqTM 4000测序平台对存在生长差异的墨瑞鳕肌肉组织进行转录组测序分析,获得的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等数据库中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行GO功能注释及KEGG信号通路富集分析,并采用MISA进行SSR鉴定分析。【结果】从墨瑞鳕肌肉组织中共测序获得39749条Unigenes,其长度范围在301~55230 bp,平均长度为1705 bp。注释到Nt、Nr、Swiss-Prot、Pfam数据库的Unigenes分别有27046、20824、18268和17772条,在7个数据库中均得到注释的Unigenes共计6742条,占Unigenes总数的16.96%。根据差异表达基因筛选条件P<0.05且|log2 Fold Change|>1,共筛选出722个差异表达基因,其中上调基因308个、下调基因414个。差异表达基因GO功能注释分析结果表明,注释基因数目较多的GO功能条目包括细胞过程、代谢过程、膜、细胞器及结合等;KEGG信号通路富集分析发现,差异表达基因被成功富集到234条信号通路上,主要涉及磷脂酰肌醇3激酶/蛋白激酶信号通路、MAPK信号通路、胰岛素信号通路及FoxO信号通路等。在39749条Unigenes中鉴定筛选出22120个SSRs,占Unigene总数的55.65%,SSR的平均间距为3063 bp。【结论】基于转录组测序分析获得的墨瑞鳕肌肉组织差异表达基因以发挥结合、细胞过程及代谢过程等功能为主,且主要富集在PI3K-Akt信号通路、核糖体信号通路、FoxO信号通路及细胞凋亡等能量代谢相关通路上,通过共同协调而对墨瑞鳕的生长发育起调控作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号