首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 671 毫秒
1.
【目的】获得冬瓜转录组序列、遗传变异等信息,从中挖掘冬瓜基因数据及SSR分子标记,为冬瓜后续研究提供数据支撑。【方法】以冬瓜嫩叶为材料,利用Illumina HiSeq~(TM)2000技术对冬瓜进行转录组测序,构建数据库从中获得干净序列。经De novo拼接组装后,将获得的单基因簇(Unigene)数据在非冗余蛋白数据库(nonredundant protein database,Nr)、蛋白质序列数据库(Swiss Prot protein database,Swiss Prot)、基因本体论数据库(gene ontology,GO)、蛋白质真核同源数据库(eukaryotic orthologous groups,KOG)、东京基因与基金组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)、蛋白质家族域数据库(protein families database,Pfam)6个公共数据库中进行比对,最终得到冬瓜单基因簇注释信息。利用MISA软件对转录组单基因簇进行搜索,获得单基因簇中的SSR位点。【结果】从冬瓜嫩叶中得到62 021 032条高品质序列,组装后获得40 611条单基因簇,平均长度955 bp。将所有单基因簇在Nr和Swiss Prot数据库中进行比对,结果分别比对到27 474及19 573条单基因簇;在GO数据库中,所注释到的10 659条单基因簇分别匹配到生物功能、分子功能和细胞组分3个本体的47个功能组中;与KOG数据库进行注释比对,根据其功能将注释到的单基因簇划分为25类;KEGG数据库比对注释到10 799条冬瓜的单基因簇,可分为5个大类、19个亚类、125条代谢途径;在Pfam数据库中比对到17 990条单基因簇,分属于369个类群。SSR位点搜索发现,有5 086条单基因簇包含SSR序列,获得5 474个SSR位点。【结论】利用高通量测序获得大量冬瓜转录组信息,有助于从分子水平对冬瓜进行深入研究。  相似文献   

2.
[目的]分析藤茶高通量转录组序列,从中挖掘出黄酮类化合物合成相关基因,为进一步揭示藤茶黄酮类化合物生物合成调控机制提供理论参考.[方法]分别采集藤茶的幼叶和成熟叶,提取其总RNA构建cDNA文库,采用Il-lumina HiSeqTM 4000高通量测序平台对藤茶叶片进行转录组测序,经过滤处理后运用Trinity组装,将获得的Unigene与Nr、Nt、Pfam、Swiss-Prot、GO、KO和KOG 7个数据库进行比对注释,并预测Unigenes的编码区序列(CDS);基于KEGG信号通路富集分析,发掘藤茶黄酮类化合物合成相关基因.[结果]藤茶叶片转录组测序获得82126236条原始测序序列(Raw reads),过滤处理后得到80156972条高质量序列(Clean reads),进一步组装拼接得到92472条Unige-nes,平均长度为1208 bp,N50长度为1780 bp,其中,至少在1个数据库注释的Unigenes有84217条,占Unigenes总数的91.07%,有8944条Unigenes在7个数据库均被注释,占Unigenes总数的9.67%.在GO数据库成功注释的41116条Unige-nes可分为生物学过程、细胞组分和分子功能三大类,共56个小类;在KOG数据库注释的14553条Unigenes可分成25类,其中,一般功能预测注释成功的Unigenes最多(1946条);其次是翻译后修饰、蛋白质翻转、分子伴侣(1776条),参与次生代谢物质的生物合成、转运和降解的Unigenes较少,仅有319条;KEGG信号通路富集分析发现,共有15262条Unigenes注释到128条KEGG信号通路,以注释为代谢的Unigenes最多,为8694条,其中筛选获得有98个黄酮类化合物合成相关基因,分别编码苯丙烷代谢通路的3种关键酶和类黄酮代谢通路的14种关键酶.藤茶叶片转录组Unigenes与Swiss-Prot和Nr数据库比对,获得52582条CDS序列,ESTScan 3.0.3预测获得35535条CDS序列.[结论]藤茶在细胞过程、代谢过程、单有机体过程、细胞和细胞部分、结合和催化活性能力分布的基因较丰富,在一般功能、翻译、翻译后修饰、蛋白质翻转及分子伴侣的基因表达量较高,具有较强的碳水化合物代谢能力.多种关键酶基因参与藤茶黄酮类化合物的生物合成,推测其生物合成途径存在多条分支,调控机制也较复杂.  相似文献   

3.
运用高通量技术对杂交鳢进行转录本测序和数据分析,经拼接与组装,最终获得52 065条unigenes,长度范围201~12 407 bp,序列平均长度为710 bp。从长度分布、GC含量和基因表达量等方面对unigenes进行评估,数据显示测序质量较好。进一步的数据分析,共鉴定出20 535个CDS,37 324个SNP位点和7 830个微卫星。用6大数据库Swiss–Prot、Nr、Pfam、KEGG、KOG和GO注释杂交鳢转录组unigenes,分别对应有20 955、28 938、19 339、14 052、19 358和18 635条unigenes获得注释。根据GO数据库的注释,可将这些unigenes分为生物过程、细胞组分和分子功能3大类共50亚类。KEGG代谢通路分析表明,这些unigenes参与了5大类30亚类共268个代谢通路,其中,参与信号转导通路的unigenes数量最多,有1 716条。  相似文献   

4.
基于边合成边测序( Sequencing By Synthesis ,SBS)技术,使用Illumina HiSeq2500高通量测序平台对长白落叶松cDNA文库进行测序。共获得非重复序列基因58683条,总长度为55283938 bp。将得到的转录本使用BLAST软件将非重复序列基因序列与NR、Swiss-Prot、GO、COG、KEGG数据库比对,通过选择BLAST参数E-value不大于10-5,最终获得29350个有注释信息的基因序列,其中19292个转录本注释GO编号,有9112个转录本在COG数据库中被注释并分为25个功能分类,同时注释到120条KEGG代谢途径。在得到注释的转录本中搜索到木质素相关基因共68条,其中与木质素合成相关基因29条,与木质素分解代谢相关基因27条;找到了147条纤维素相关基因,其中与纤维素合成相关基因103条,与纤维素分解代谢相关基因44条。  相似文献   

5.
为探究可变剪接影响下更为复杂的脂肪沉积调控网络,明晰可变剪接事件的发生对脂肪沉积调控机制的影响,本研究基于PacBio测序平台的第三代测序技术,对夷陵黄牛腹腔脂肪、皮下脂肪、肌间脂肪进行全长转录组测序分析。共发现15 445个基因检测到50 520个可变剪接,占牛全部基因的33.4%。对这些基因进行富集分析发现,83个GO条目显著富集,这些显著富集的通路可能参与脂肪沉积网络的调控,其中16个与脂质合成及代谢相关,27条KEGG通路显著富集,其中15条与脂质合成及代谢相关。使用KOG、KEGG、NR、Swiss Prot、GO数据库对测序序列进行注释,80 756条序列共注释到69 259个基因,94 458条CDS序列及对应的pep序列。其中GO分析中15 039条序列富集到507个生物学过程条目,7 907条序列富集到214个细胞组分条目,30 672条序列富集到559个分子功能条目。KEGG数据分析富集到34条通路共49 710条序列,其中7 002条序列参与信号转导途径。以上结果表明,牛脂肪组织存在大量可变剪接事件,并且这些发生可变剪接事件的基因对脂肪沉积的调控发挥重要作用,这可...  相似文献   

6.
【目的】掌握不同生长规格墨瑞鳕个体间差异表达基因的表达特点,为其功能相关基因深度挖掘及分子遗传育种提供科学依据。【方法】挑选同一养殖条件下极大个体和极小个体的墨瑞鳕,构建肌肉组织cDNA文库后,采用Illumina HiSeqTM 4000测序平台对存在生长差异的墨瑞鳕肌肉组织进行转录组测序分析,获得的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等数据库中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行GO功能注释及KEGG信号通路富集分析,并采用MISA进行SSR鉴定分析。【结果】从墨瑞鳕肌肉组织中共测序获得39749条Unigenes,其长度范围在301~55230 bp,平均长度为1705 bp。注释到Nt、Nr、Swiss-Prot、Pfam数据库的Unigenes分别有27046、20824、18268和17772条,在7个数据库中均得到注释的Unigenes共计6742条,占Unigenes总数的16.96%。根据差异表达基因筛选条件P<0.05且|log2 Fold Change|>1,共筛选出722个差异表达基因,其中上调基因308个、下调基因414个。差异表达基因GO功能注释分析结果表明,注释基因数目较多的GO功能条目包括细胞过程、代谢过程、膜、细胞器及结合等;KEGG信号通路富集分析发现,差异表达基因被成功富集到234条信号通路上,主要涉及磷脂酰肌醇3激酶/蛋白激酶信号通路、MAPK信号通路、胰岛素信号通路及FoxO信号通路等。在39749条Unigenes中鉴定筛选出22120个SSRs,占Unigene总数的55.65%,SSR的平均间距为3063 bp。【结论】基于转录组测序分析获得的墨瑞鳕肌肉组织差异表达基因以发挥结合、细胞过程及代谢过程等功能为主,且主要富集在PI3K-Akt信号通路、核糖体信号通路、FoxO信号通路及细胞凋亡等能量代谢相关通路上,通过共同协调而对墨瑞鳕的生长发育起调控作用。  相似文献   

7.
膜果麻黄种子不同发育时期的转录组测序分析   总被引:1,自引:0,他引:1  
以不同萌发期间的膜果麻黄(E.przewalskii)种子为研究对象,应用新一代高通量测序技术平台Illumina Hi SeqTM2000对其进行转录组测序和数据重新组装,结果获得了12 999 122条初始序列,总长为1 169 920 980bp,初始序列组装获得序列片段的平均长度与N50值分别为351和548 bp;与COG功能注释、GO分类及KEGG代谢通路分析后,获得了49 449个GO功能注释、17 751个COG功能注释以及16 748个KEGG注释;并从KEGG通路中找到有关芪类、二芳基庚烷和姜醇合成途径的编码基因片段230个。  相似文献   

8.
研究表明,铁皮石斛在增强人体免疫力方面具有良好作用。为了明确铁皮石斛潜在的免疫活性成分及其作用机制,本研究从PubChem、SciFinder数据库中收集铁皮石斛小分子化合物及其化学结构相关的研究,然后通过Swiss ADME筛选优效目标化合物。通过Swiss Target Prediction预测优效化合物的靶点集,并通过Genecards数据库获取免疫调节相关靶点集,两者取交集得到铁皮石斛免疫调节相关靶点集,进一步通过Cytoscape软件建立化合物-靶点网络图,将交集靶点导入STRING构建蛋白互作网络(PPI),筛选出核心靶点。通过R的Cluster Profiler包对核心靶点进行功能富集分析,包括基因本体分析(GO)及通路富集分析(KEGG),最终建立化合物-靶点-生物功能网络。最终,共筛选出优效化合物124个,对应靶点421个;与免疫调节相关化合物58个,对应靶点60个;其中黄酮类化合物对应的免疫靶点较多,可能为主要的免疫活性成分。得到9个免疫调节相关核心靶点,GO分析发现这些核心靶点共参与了2 059个条目,KEGG分析获得153个代谢通路。本研究通过化合物-靶点-生物功能网络展示了铁皮石斛多成分、多靶点、多通路的作用特点,为后续作用机制的深入研究和验证提供了可行方向。  相似文献   

9.
为进一步开发大竹蛏Solen grandis的基因资源,采用2代Illumina Hi-seq测序技术对大竹蛏的鳃组织进行了转录组测序,构建了转录组数据库,获得338 483 476条Clean Reads数据;拼接组装后获得190 856条Unigene数据,平均长度为1147 bp;与NR、NT、KO、Swiss Prot、PFAM、GO、KOG等数据库进行Blast信息比对(E-value为10-5),共获得63 337个注释基因;与NR数据库比对发现,大竹蛏转录组基因序列与长牡蛎Crassostrea gigas具有较高的同源性,为53.3%;将大竹蛏转录组的Unigene的功能通过与KOG数据库进行注释比对划分为25类;GO数据库注释可分为三类,即细胞组分、生物过程和分子功能,共包括65个分支;KEGG分析发现,大竹蛏转录组数据中按照代谢通路可分为92类,利用Blast蛋白库比对和Estscan软件进行ORF预测,获得长度大于300 nt的ORF共50 681个;通过SSR分析,共获得73 089个SSR标记。本研究中获得的转录组信息可为今后进行大竹蛏分子标记的开发和关键基因的克隆及功能分析等研究提供基础数据。  相似文献   

10.
旱柳转录组测序及生物学分析   总被引:1,自引:0,他引:1  
对盐敏感旱柳沿江柳和耐盐旱柳9901的杂交F_1代根部进行了RNA-Seq测序和分析,共获取了107 950条Unigene,平均长度为1 076.96 bp。通过与COG、GO等8个数据库比对,60 848个基因获得注释信息,其中38 182条Unigene在GO数据库中获得注释,24 101条Unigene在KEGG数据库中获得注释。GO和KEGG富集分析结果表明,差异表达基因主要调节核糖体代谢、植物激素信号转导等生物学功能。  相似文献   

11.
为研究兔眼越橘新梢中基因转录和抗氧化物代谢相关通路的基因表达,利用Illumina Solexa技术和生物信息学方法对兔眼越橘品种‘粉蓝’新梢进行转录组测序分析。结果表明,测序数据组装后共获得64 185条单体序列;将其与COG、KEGG、GO、NR和Swiss-Prot数据库比对后发现,共有37 900条单体与葡萄、桃、番茄、蓖麻、毛果杨、草莓等物种的基因具有同源性;基于COG数据库分析后可见,12 559条序列可归属其中,而转录类、复制-重组-修复类、翻译后修饰-蛋白质周转-分子伴侣类位居前列;基于KEGG数据库分析发现,19条抗氧化相关代谢通路中,黄酮类、苯丙素类代谢通路是活跃通路,叶酸类、类胡萝卜素、二苯乙烯类、二芳基庚酸类、姜酚、二萜类化合物的合成通路是部分支路活跃,而其他抗氧化相关通路基本无法产生预期功能成分。  相似文献   

12.
蜡梅花转录组数据分析及次生代谢产物合成途径研究   总被引:2,自引:0,他引:2  
蜡梅是特产于我国的具有优良观赏性状的传统花卉,除了用于园林绿化外,还具有重要的药用价值。蜡梅的分子生物学研究开展较晚,基因数据库资源极少。本文采用Illumina GAIIx高通量测序——转录组测序(RNA-seq)技术对蜡梅花进行转录组测序,获得了超过3.8Gb的数据。将获得的Unigene与4个基因数据库进行比较,并对Unigene进行功能预测。结果表明,蜡梅花转录组数据库中的Unigene可归纳到43个GO聚类中,其中有大量的基因与代谢过程、催化反应、结合过程和细胞进程相关。代谢途径的分析有助于对基因生理功能的预测,库中31142个Unigene可定位到266个不同的代谢分支中。对蜡梅花转录组的组装和功能注释获得了大量转录本信息,为蜡梅的分子生物学研究提供了宝贵的基因组数据来源。基于蜡梅花的生理特性,初步探索利用蜡梅花转录组数据库研究次生代谢产物,分析转录组数据库中与花香、花色、生物碱合成途径相关的基因,发掘蜡梅研究开发应用新领域。  相似文献   

13.
【目的】对青花菜花蕾进行转录组测序分析,并挖掘与蜡粉合成相关基因,为探明青花菜花球表面蜡粉形成的分子机制提供理论参考。【方法】分别提取野生型和蜡粉缺失型青花菜花球总RNA,采用Illumina HiSeqTM 2500平台进行转录组测序,获得高质量Clean reads,采用Trinity进行序列组装后获得青花菜Unigene库,将获得的Unigene序列与Nr、Nt、KEGG、Pfam、KOG/COG、Swiss-Prot和GO数据库比对,获得基因功能注释信息;使用DESeq2进行差异表达分析。【结果】共获得44.68 Gb Clean data,De novo组装得到41244条Unigenes,N50长度为1847 bp。从所获得的Unigenes中筛选出8685个差异表达基因(DEGs)(上调基因5747个,下调基因2938个),共有8038个基因被注释到不同数据库,其中,5220个基因注释到Pfam数据库; 2066个基因注释到COG数据库,3866个基因注释到KOG数据库; 2580个差异表达基因被注释到75个转录因子家族中,注释最多的是MYB家族(235个);GO数据库中6095个差异表达基因注释到细胞组分、分子功能和生物学过程三大类的52个功能分类; KEGG数据库中,1671个差异表达基因富集到138条代谢通路,其中13个差异表达基因与脂肪酸合成有关,7个差异表达基因与蜡粉生物合成途径有关。【结论】转录因子MYB家族在调控青花菜蜡粉合成中发挥重要作用。蜡粉合成过程中相关酶基因的差异表达是调控青花菜蜡粉合成的关键,尤其是野生型和蜡粉缺失突变体中特异性表达的差异表达基因,可作为后续研究青花菜花球表面蜡粉形成分子机制的对象。  相似文献   

14.
15.
以被假眼小绿叶蝉侵染0、12、24h的都匀毛尖本地种茶树叶片为试验材料,采用超高效液相色谱–串联四级杆飞行时间质谱技术对试验材料的代谢产物进行定性和定量分析,正离子模式下鉴定出1094个代谢物。采用主成分分析、正交偏最小二乘法判别分析,根据差异倍数筛选出0 h与12 h处理有20个差异代谢物,其中6个差异代谢物的含量上调,14个下调;0 h与24 h处理之间有41个差异代谢物,其中26个上调,15个下调;12h与24 h处理有59个差异代谢物,其中45个上调,14个下调。0 h与12 h处理有2个差异代谢物注释到KEGG数据库中,其中芥子酸注释到苯丙素生物合成途径中,与木质素形成有关;0 h与24 h处理有6个差异代谢物注释到KEGG数据库中,其中6,9,12,15十八碳四烯酸乙酯注释到亚麻酸代谢通路,没食子儿茶素注释到类黄酮生物合成,苯乙醛注释到苯丙氨酸代谢通路,推测苯乙醛会对周围的假眼小绿叶蝉造成其行为或生理的影响,而苯丙氨酸经苯丙氨酸解氨酶等酶催化合成木质素和类黄酮等;12 h与24 h处理有9个差异代谢物注释到9条通路中,马钱苷酸注释到单萜生物合成通路中,相比侵染12 h处理,...  相似文献   

16.
为探讨辣木叶营养价值形成的遗传基础,采用RNA-seq对不同发育时期的辣木叶混合样品进行转录组测序,获得44 056 449个reads,共组装得到75 452条unigene,平均长度为795.69nt,其中有15 824条unigene长度大于1 000nt。采用公共数据库进行同源比对,共有30 847条unigene得到注释。其中,有18 277条unigenes被注释到GO数据库的52个功能组,9 689条unigene在COG数据库中得到注释。有10 130条unigene被富集到129条KEGG途径,包括碳代谢、氨基酸生物合成和氧化磷酸化途径。  相似文献   

17.
【目的】鉴定筛选出与卵形鲳鲹卵巢发育相关的候选基因及信号通路,为揭示其卵巢性成熟过程的分子机制打下基础。【方法】挑选卵巢发育处于?期和Ш期的雌性卵形鲳鲹,分别构建卵形鲳鲹卵巢?期和Ш期的cDNA文库,采用Illumina HiSeqTM 2500进行转录组测序,经过滤、质量控制及拼接组装后获得的Unigenes在七大数据库(Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO)中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行功能注释及信号通路富集分析,并采用MISA和GATK3进行SSR鉴定及SNP分析。【结果】卵形鲳鲹卵巢组织转录组测序获得的325156432条Raw reads,经过滤筛选得到317206752条Clean reads,拼接组装后得到59554条Unigenes;69.65%的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等七大数据库中注释成功,其中有24599条Unigenes被注释到GO数据库,15997条Unigenes被注释到KEGG数据库。在卵形鲳鲹卵巢组织的2个发育时期共鉴定获得56115个基因,经差异表达分析后获得17737个差异基因,其中8169个基因在卵巢Ш期上调表达、9568个基因在卵巢Ш期下调表达。GO功能注释分析发现,卵形鲳鲹卵巢差异表达基因主要注释在细胞过程、氮化合物代谢过程、初级代谢过程、核、核部分、离子结合及水解酶活性等条目上;而KEGG信号通路富集分析结果显示,17737个差异表达基因显著富集在318条代谢途径上,其中前20条KEGG信号通路包括2-氧代羧酸代谢、PI3K-Akt信号通路、甲状腺激素信号通路、磷脂酶D信号通路、Fc εRI信号通路和细胞周期等。卵形鲳鲹卵巢转录组(59554条Unigenes)中共存在30133个SSRs和82490个SNPs。【结论】GnRHR、FSHR、FSHβ、CYP11A、SIRT3和PEG3等差异表达基因及PI3K-Akt信号通路和VEGF信号通路等与卵形鲳鲹卵巢的发育密切相关,共同调节卵巢的发育与成熟,在卵巢性成熟过程中发挥重要作用。  相似文献   

18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号