首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
【目的】基于黄地老虎转录组测序结果,对其SSR及SNP位点信息进行分析。【方法】对黄地老虎总RNA进行提取,使用Illumina平台对转录组进行测序,利用MISA和GATK软件分别对黄地老虎转录组的SSR和SNP位点特征信息进行分析。【结果】黄地老虎转录组数据库包含66 469条Unigene序列。利用MISA对Unigene序列进行搜索,得到SSR位点4 438个,分布于4 048条Unigene序列上,占总序列的6.09%。其中,以单碱基和三碱基重复为主,分别占总重复类型的54.73%和29.29%。A/T基元是黄地老虎SSR的优势基元。SSR基元包含4~24次重复,以5次重复(21.67%)为主。SSR位点序列长度为12~127 bp,包含3 493个中等多态性位点、820个高度多态性位点。利用GATK对Unigene序列SNP位点进行搜索,得到转换类型(237 619个)和颠换类型(133 529个)共371 148个。C/T占SNP位点总数的18.61%,比率最高;G/A位居其次(18.28%),均属于转换类型。转换类型(64.02%)显著高于颠换类型(35.98%)。【结论...  相似文献   

2.
【目的】鉴定筛选出与卵形鲳鲹卵巢发育相关的候选基因及信号通路,为揭示其卵巢性成熟过程的分子机制打下基础。【方法】挑选卵巢发育处于?期和Ш期的雌性卵形鲳鲹,分别构建卵形鲳鲹卵巢?期和Ш期的cDNA文库,采用Illumina HiSeqTM 2500进行转录组测序,经过滤、质量控制及拼接组装后获得的Unigenes在七大数据库(Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO)中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行功能注释及信号通路富集分析,并采用MISA和GATK3进行SSR鉴定及SNP分析。【结果】卵形鲳鲹卵巢组织转录组测序获得的325156432条Raw reads,经过滤筛选得到317206752条Clean reads,拼接组装后得到59554条Unigenes;69.65%的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等七大数据库中注释成功,其中有24599条Unigenes被注释到GO数据库,15997条Unigenes被注释到KEGG数据库。在卵形鲳鲹卵巢组织的2个发育时期共鉴定获得56115个基因,经差异表达分析后获得17737个差异基因,其中8169个基因在卵巢Ш期上调表达、9568个基因在卵巢Ш期下调表达。GO功能注释分析发现,卵形鲳鲹卵巢差异表达基因主要注释在细胞过程、氮化合物代谢过程、初级代谢过程、核、核部分、离子结合及水解酶活性等条目上;而KEGG信号通路富集分析结果显示,17737个差异表达基因显著富集在318条代谢途径上,其中前20条KEGG信号通路包括2-氧代羧酸代谢、PI3K-Akt信号通路、甲状腺激素信号通路、磷脂酶D信号通路、Fc εRI信号通路和细胞周期等。卵形鲳鲹卵巢转录组(59554条Unigenes)中共存在30133个SSRs和82490个SNPs。【结论】GnRHR、FSHR、FSHβ、CYP11A、SIRT3和PEG3等差异表达基因及PI3K-Akt信号通路和VEGF信号通路等与卵形鲳鲹卵巢的发育密切相关,共同调节卵巢的发育与成熟,在卵巢性成熟过程中发挥重要作用。  相似文献   

3.
【目的】开展荸荠球茎发育过程转录组测序研究,为研究荸荠球茎发育过程相关基因表达信息提供参考。【方法】运用高通量测序技术,对荸荠球茎不同发育时期进行转录组测序研究。【结果】组装共得到223 182条转录本和90 542条Unigene,平均长度为809 bp,N50为1119。组装完整性较高,效果较好。对所得Unigene进行不同数据库注释,共有50 583条Unigene成功注释到7个数据库(NR、GO、NT、Pfam、KEGG、KOG及Swiss-prot)。对差异表达基因分析,发现球茎膨大初期的差异表达基因数目最多,为最活跃阶段。GO功能富集分析结果表明,33 205个基因获得功能注释,分为分子功能、细胞组分和生物学过程等3大类和54个亚类。COG功能分类结果表明,17 743个基因分布于25个功能区域,其中碳水化合物代谢占重要地位。KEGG代谢通路注释结果表明有20 667个基因获得功能注释,共有116条代谢途径,其中淀粉-蔗糖代谢占主要作用。【结论】利用高通量转录组测序技术首次建立了荸荠优良品种‘桂蹄3号’球茎的转录组数据库,为进一步研究荸荠球茎淀粉生物合成相关基因的功能及形成的分子机制提供了数据基础。  相似文献   

4.
杜梨(Pyrus betulifolia Bunge)抗逆性强,叶色随季节变化而改变,被广泛用于沿海滩涂景观改造,是园林绿化中常用树种。为了解杜梨色叶相关基因调控途径,对杜梨叶片进行转录组测序,共获得67.7 Gb测序数据,通过组装共得到60 611个基因,其中包含1 059个新基因;与8个功能数据库进行比对分析,共57 669个基因得到了功能注释,注释效率为95.15%;GO分析发现,已注释的差异表达基因共涉及49个功能组,主要集中在膜(细胞组分)、催化活性(分子功能)、代谢过程(生物学过程)等中;KEGG分析发现,差异表达基因主要富集在碳代谢和植物-病原体相互作用等生物学过程中;共筛选出10个与类黄酮相关的基因,分别属于UDPGT等6个基因家族;在杜梨叶片转录组中共筛选出452 501个SNP位点,碱基转换类型所占比例远远高于颠换类型,表明杜梨具有丰富的SNP位点信息。本研究结果可为探究杜梨色叶分子机制等提供理论依据。  相似文献   

5.
c-GMP诱导对盐胁迫下番茄的转录组分析   总被引:1,自引:0,他引:1  
以市场常见的番茄为材料,采用Illumina高通量测序技术对NaCl胁迫、c-GMP诱导以及两者组合处理下番茄幼苗进行转录组测序。结果表明:共获得83.35 Gb的原始数据,Q30碱基百分比在90.91%及以上,分别将各样品的原始读数与指定的参考基因组进行序列比对,比对效率从88.03%到92.74%不等。同时将得到的31 734条序列注释到不同的数据库(GO、KEGG、KOG、NR、Pfam、Swiss-Prot和egg NOG),通过GO数据库,将其划分到细胞组分、分子功能以及生物学过程三大注释类别下的51个亚功能组中,通过COG数据库与KEGG数据库将其分别注释到25个类别与128个代谢通路。在NaCl胁迫、c-GMP诱导以及两者组合处理下共发现SNP位点127 944个,其中仅有22.6%的SNP位点位于非编码区。差异基因结果显示,c-GMP能诱导盐胁迫下更多基因的表达。该转录组测序数据可靠,结果覆盖面广,为番茄c-GMP诱导盐胁迫下基因挖掘与功能研究提供了理论依据。  相似文献   

6.
【目的】筛选出凡纳滨对虾生长发育的功能基因及代谢调控网络,揭示其生长发育的分子机制,为后续开展凡纳滨对虾分子生物学研究提供宝贵的基因数据来源。【方法】以快速生长群体和慢速生长群体的凡纳滨对虾肌肉组织为研究材料,通过Illumina HiSeqTM2500平台对构建的cDNA文库进行高通量测序分析,以StringTie进行拼接组装后利用DESeq2筛选差异表达基因,并基于KOG、GO、nr、COG、Swiss-Pro、KEGG和Pfam等数据库进行差异表达基因功能注释分析。【结果】经拼接组装共获得53458844条Clean reads,各样品Clean reads的Q30均在93.00%以上;Illumina测序获得的Clean reads与参考基因组的比对效率在87.75%~87.80%,说明转录组测序数据真实可靠。采用SnpEff进行SNP/InDel变异注释分析,结果显示,SNP位点中以A>G、G>A、C>T和T>C等4种类型的数量较多(14950~21562个),InDel位点则以SYNONYMOUS_CODING的数量最多(33630个)。使用StringTie对Mapped reads(比对到参考基因组的Reads)进行拼接,共发掘到4607个新基因,分别输入COG、GO、KEGG、KOG、Pfam、Swiss-Prot、eggNOG和nr数据库中进行序列比对,最终发现共有1098个新基因被注释,以被nr数据库注释的新基因数量最多(1077个),而被COG数据库注释的新基因数量最少(416个)。基于Q-value<0.05且Fold Change>2的筛选条件,共获得1408个差异表达基因(661个为显著上调表达基因,747个为显著下调表达基因);1408个差异表达基因被注释到53个GO功能条目中,其中,22条被注释到生物学过程(Biological process),16条被注释到细胞组分(Cellular component),15条被注释到分子功能(Molecular function);KEGG信号通路富集分析发现3条重要的信号通路,分别是溶酶体通路(Lysosome)、氨基糖和核苷酸糖新陈代谢(Amino sugar and nucleotide sugar metabolism)及鞘脂类代谢(Sphingolipid metabolism)。在溶酶体通路中,CTSL基因、Nramp基因、MyoG基因和Myf5基因在凡纳滨对虾快速生长群体肌肉组织中呈上调表达,而Trypsin基因呈下调表达。【结论】通过转录组测序分析从快速生长群体和慢速生长群体的凡纳滨对虾肌肉组织中筛选出1408个差异表达基因(661个为显著上调表达基因,747个为显著下调表达基因),主要富集在溶酶体、氨基糖和核苷酸糖新陈代谢及鞘脂类代谢等通路上,在对虾肌肉生长发育过程中发挥重要作用。  相似文献   

7.
为探究月月竹竹秆受到光照由绿色变为紫色的分子机制,本研究采集月月竹同一竹节紫色部分(Z)、渐变部分(M)和绿色部分(L)的竹青,提取RNA,利用PacBio Sequel三代全长转录组测序技术,结合生物信息学方法对不同颜色的竹青进行全长转录组分析。结果表明,经过三代测序和数据质量控制,共获得非冗余转录本66 961条,长度为500~3 000 bp,平均长度1 389.22 bp,序列总长度为93.02 Mbp,N50为1 830 bp, G+C碱基含量为49.56%。利用NR、Swiss-Prot、COG、GO、KEGG和Pfam数据库对所有转录本进行功能注释,共有56 938条转录本被成功注释,占全部转录本的85.03%;49 115条转录本被GO注释,其中催化活性、细胞器、代谢过程分别是GO数据库分子功能、细胞组分和生物过程中含转录本最多的项目;28 231个转录本被KEGG数据库注释,其中与碳水化合物代谢和基因翻译相关的转录本最多。结合GO注释和KEGG注释,66 961条转录本中有381条转录本与光信号的感受、传递以及光调控相关,包括红光和远红光的受体蛋白PHYA、PHYB及...  相似文献   

8.
[目的]发掘出一批玫瑰SNP候选位点,为进一步开发玫瑰EST-SNP标记及研究玫瑰遗传背景、相关性状的分子标记等打下基础.[方法]从美国国立生物技术信息中心(NCBI)的dbEST数据库下载27125条玫瑰EST序列,经生物信息学方法分析,发掘玫瑰EST-SNP位点,并对其所在核苷酸序列进行功能注释分析.[结果]对27125条EST进行拼接,共得到3544条重叠群(Contigs),其中有243个Contigs含有SNP候选位点.从中筛选出224个候选EST-SNP位点,其碱基突变类型中转换和颠换的数量分别占SNP候选位点总数的59.8%和27.2%.通过序列比对分析,发现有22个SNP位点来源于蔷薇科植物(与玫瑰同科),其中来源于野草莓的基因最多(8个),另有15个SNP位点所在的EST序列与某些软体动物门物种的基因具有较高同源性.[结论]NCBI中的玫瑰EST数据库数据庞大,足够发掘出大量的SNP标记,使得以EST-SNP对蔷薇科玫瑰等植物进行品种鉴定、分类、遗传多样性分析具有可行性.  相似文献   

9.
为了挖掘罗氏沼虾免疫相关单核苷酸多态性(SNP),采用第二代高通量测序技术,对罗氏沼虾的肝胰腺进行转录组深度测序分析。结果发现SNP位点37 589个,其中转换25 188个,颠换12 401个。再对SNP所在的基因进行GO(gene ontology)分类和KOG注释,分别筛选到2 451个有GO注释和2 458个有KOG注释的SNP,并重点对4个重要免疫通路的145个免疫相关基因,筛选出129个SNP位点。相关研究结果将为进一步系统挖掘免疫相关SNP的分子遗传标记奠定基础,为罗氏沼虾疾病防控和选育抗病新品种提供科学参考。  相似文献   

10.
【目的】研究紫花苜蓿(Medicago sative L.)细胞质雄性不育(CMS)的机理,为紫花苜蓿利用不育系的育种工作提供理论基础。【方法】本研究以紫花苜蓿细胞质雄性不育系MSGN1A及其保持系MSGN1B为材料,进行转录组测序(RNA-Seq)以及基因功能注释,筛选与不育系机理相关的差异表达基因及代谢通路。【结果】Illumina测序共得到紫花苜蓿95 679条功能基因,经过差异表达分析筛选出187个显著差异表达的基因(DEGs),其中包括18个上调基因,169个下调基因。采用GO、KEGG、COG注释库分别对187个DEGs进行功能注释,其主要涉及催化活性、代谢活动、信号传导机制、合成、膜功能、碳水化合物运输和代谢、能量代谢等相关通路。【结论】筛选出与紫花苜蓿细胞质雄性不育性相关的代谢通路,初步探讨了紫花苜蓿细胞质雄性不育系的分子机理。  相似文献   

11.
利用RNA-seq技术对所构建的野生毛葡萄(Vitis quinquangularis Rehd)叶片的转录组进行测定,对原始reads进行过滤和组装,得到了35 238条质量较高的unigene,平均长度为1 081 nt,N50为1 735 nt。基于NCBI蛋白质数据库(Nr)、蛋白质序列数据库(Swiss-Prot)、京都基因与基因组百科全书(KEGG)数据库和直系同源基因簇(COG)进行相似性比对,共注释了26 751条unigene,另有8 487条unigene未被注释。物种同源性显示与葡萄的同源性最高为74.48%。利用COG数据库将unigene分成25类,通过GO分类和KEGG富集性分析,将unigene分别归类于44个GO类别和122个代谢途径。此外,在35 238条unigene中共搜索到4 428个SSR位点,二核苷酸的SSR数目最多(1 906条),其次为三核苷酸(1 762条)。这些信息为毛葡萄功能基因、相关候选基因的发掘以及分子标记辅助育种提供了重要依据。  相似文献   

12.
【目的】探究不同外源糖对葡萄试管苗生长发育及蛋白激酶基因转录调控的影响,应用转录组测序挖掘蛋白质磷酸化过程中的基因,为葡萄蛋白激酶相关基因功能的验证奠定一定基础。【方法】在基本培养基中分别添加2%的蔗糖、葡萄糖和果糖,以无糖为对照,分别命名为S20、G20、F20和CK,经过37 d培养后,测定不同处理的地上和地下鲜重,并采用Illumina HiSeq TM 2000对各处理叶片进行转录组测序,通过综合生物信息学分析(参考基因组比对、差异基因(DEGs)筛选、COG(Cluster of Orthologous Groups of proteins)注释、GO(Gene Ontology)注释等)筛选出蛋白激酶相关基因,通过qRT-PCR分析该蛋白激酶相关基因的表达特性。【结果】F20、G20和S20处理下的葡萄(‘红地球’)试管苗与CK相比,地上鲜重具有明显差异,且F20最高,而G20地下鲜重最高。SNP统计发现,转换是主要的变异类型,颠换次之,且发生在基因间区的SNP数量最多,其次是下游;剪接位点供体和同义终止发生的基因数量最少且相等。4个样品中共获得了2 633个差异基因,3个处理与CK相比,共有差异基因180个且被聚类为3组,第一组中127个基因仅在CK中高表达,第二组19个基因仅在G20下高表达,而第三组34个基因在3个处理下表达模式不尽相同。这些共有的差异基因在COG中注释到了26个基因并分在11个功能类别中,且主要注释在一般的功能类别中。在GO分类中,共有的基因分别被注释在分子功能、生物学过程和细胞组分的14、22和13个功能类别中。共筛选出7种蛋白激酶,分别为葡萄糖激酶(Glucokinase,GK)、丝裂原活化蛋白激酶(Mitogen-activated protein kinases,MAPKs)、钙调蛋白激酶(Calcineurin protein kinase,CBL)、蛋白磷酸酶2(Protein phosphatase 2,PP2A)、己糖激酶(Hexokinase,HXK)、组氨酸蛋白激酶(Histidine protein kinase,HPK)和酪氨酸激酶(Tyrosine kinase,TK),其不同激酶的基因在不同处理中具有各自的表达模式,经qRT-PCR验证,选择的20个差异基因中有17个基因表达与转录组测序结果相一致。【结论】在葡萄试管苗培养中,果糖较葡萄糖和蔗糖相比对生长较好。测序得出180个差异基因对3种不同糖均作出响应,这些基因在COG数据库中主要富集在膜酯转运和代谢、次级代谢物和碳水化合物的合成、转运和分解;GO中大多注释在蛋白激酶和氧化还原酶的活性中;筛选出了7种蛋白激酶,这些差异基因在数量、功能分类和代谢通路上对糖的响应各不相同。  相似文献   

13.
为发掘出一批香蕉的SNP位点、进一步研究香蕉的遗传关系、相关性状的定位等打下基础,从美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)的dbEST数据库下载46 665条香蕉EST序列,经生物信息学方法分析发掘EST-SNP位点,并对其所在核酸序列进行功能注释分析。通过对46 665条EST进行拼接,共得到3 490条重叠群(contigs),在含有4条以上重叠群中发现有39条重叠群中含有SNP位点,从中筛选出127个候选SNP位点,其碱基突变类型中转换、颠换分别占SNP位点总数的63.78%、36.22%。通过序列比对分析发现了34个与香蕉相关基因,证明NCBI中的香蕉EST数据库数据量大,能够发掘出SNP标记对香蕉进行品种鉴定、分类和遗传多样性分析。  相似文献   

14.
【目的】掌握不同生长规格墨瑞鳕个体间差异表达基因的表达特点,为其功能相关基因深度挖掘及分子遗传育种提供科学依据。【方法】挑选同一养殖条件下极大个体和极小个体的墨瑞鳕,构建肌肉组织cDNA文库后,采用Illumina HiSeqTM 4000测序平台对存在生长差异的墨瑞鳕肌肉组织进行转录组测序分析,获得的Unigenes在Nr、Nt、Pfam、KOG/COG、Swiss-Prot、KEGG和GO等数据库中进行比对;通过FPKM及DEGseq筛选出差异表达基因,以GOseq和KOBAS对差异表达基因分别进行GO功能注释及KEGG信号通路富集分析,并采用MISA进行SSR鉴定分析。【结果】从墨瑞鳕肌肉组织中共测序获得39749条Unigenes,其长度范围在301~55230 bp,平均长度为1705 bp。注释到Nt、Nr、Swiss-Prot、Pfam数据库的Unigenes分别有27046、20824、18268和17772条,在7个数据库中均得到注释的Unigenes共计6742条,占Unigenes总数的16.96%。根据差异表达基因筛选条件P<0.05且|log2 Fold Change|>1,共筛选出722个差异表达基因,其中上调基因308个、下调基因414个。差异表达基因GO功能注释分析结果表明,注释基因数目较多的GO功能条目包括细胞过程、代谢过程、膜、细胞器及结合等;KEGG信号通路富集分析发现,差异表达基因被成功富集到234条信号通路上,主要涉及磷脂酰肌醇3激酶/蛋白激酶信号通路、MAPK信号通路、胰岛素信号通路及FoxO信号通路等。在39749条Unigenes中鉴定筛选出22120个SSRs,占Unigene总数的55.65%,SSR的平均间距为3063 bp。【结论】基于转录组测序分析获得的墨瑞鳕肌肉组织差异表达基因以发挥结合、细胞过程及代谢过程等功能为主,且主要富集在PI3K-Akt信号通路、核糖体信号通路、FoxO信号通路及细胞凋亡等能量代谢相关通路上,通过共同协调而对墨瑞鳕的生长发育起调控作用。  相似文献   

15.
泸定百合是非常优良的种质基因资源,鳞茎研究是其科研和生产的关键环节,然而泸定百合鳞茎的分子生物学研究尚属空白。为揭示泸定百合鳞茎的分子机制,应用高通量测序技术对泸定百合的鳞茎进行转录组分析。原始数据经过生物信息学分析后,共获得4.9 G有效数据,43 412条Unigene;所获得的Unigene与NR,GO,COG和KEGG等数据库进行搜索比对后,发现有30 225条和21 531条Unigene分别获得NR和GO注释,14 069条Unigene得到COG注释,GO注释中获得374条Unigene可能作为转录因子参与泸定百合鳞茎的形成与发育;共有10 822条Unigene参与了KEGG代谢途径,其中有571条Unigene注释到次生代谢合成途径,其中66条和23条Unigene分别参与了萜类和生物碱的合成。研究结果为采用生物技术手段提高百合的药用成分的含量及改善其园艺性状积累了基本资料。  相似文献   

16.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

17.
膜果麻黄种子不同发育时期的转录组测序分析   总被引:1,自引:0,他引:1  
以不同萌发期间的膜果麻黄(E.przewalskii)种子为研究对象,应用新一代高通量测序技术平台Illumina Hi SeqTM2000对其进行转录组测序和数据重新组装,结果获得了12 999 122条初始序列,总长为1 169 920 980bp,初始序列组装获得序列片段的平均长度与N50值分别为351和548 bp;与COG功能注释、GO分类及KEGG代谢通路分析后,获得了49 449个GO功能注释、17 751个COG功能注释以及16 748个KEGG注释;并从KEGG通路中找到有关芪类、二芳基庚烷和姜醇合成途径的编码基因片段230个。  相似文献   

18.
李青  何斌  陈群利  游萍 《江苏农业科学》2022,50(3):28-35+48
为进一步丰富鲫鱼基因组数据,对肝脏、血液和卵巢组织进行高通量转录组测序。采用Illumina Hiseq高通量测序平台进行转录组测序,对所获得序列进行比对、基因注释、差异表达和SNP、SSR分析。结果提示,组装得到127 801条unigene,平均长度为735 bp。与相应数据库比对,最终获得117 414(91.87%)个有注释信息的unigene,有105条unigene获得GO注释,并分类到生物学过程、细胞组分和分子功能三大类42个功能中;有20 725条unigene被归纳到KOG的26个直系同源功能类型;获得KEGG注释的unigene共参与五大类32小类代谢通路。在鲫鱼肝脏、血液和卵巢组织中分别检测到307 740、343 516、348 795个SNP位点,共检测到48 808个SSR位点。提示获得有注释信息的unigene共117 414条,此外,获得一些SNP和SSR位点。结果可为进一步克隆和挖掘鲫鱼功能基因、多态性检测及群体遗传多样性分析等方面研究奠定基础。  相似文献   

19.
利用毛葡萄叶片高通量转录组测序数据进行简单重复序列(simple sequence repeat,简称SSR)搜索并对其所在的序列进行注释,从而为毛葡萄分子标记开发提供有效信息。从35 238条质量较高的unigene中搜索到4 428个SSR位点,对这些序列进行基因本体(gene ontology,简称GO)、同源蛋白质簇(cluster of orthologous groups of proteins,简称COGs)和京都基因与基因组百科全书(Kyoto encyslopedia of genes and genomes,简称KEGG)分类,给出功能注释和Pathway注释,共注释了3 197条unigene。COG数据库将SSR序列分成25类,通过GO分类和KEGG富集性分析,将SSR序列分别归类于38个GO类别和103条通路。这些序列涉及了许多重要的生物功能和代谢途径,预示着这些潜在的标记可能与重要的生物功能有关,这些信息为毛葡萄分子标记的开发和应用奠定了基础。  相似文献   

20.
【目的】对青花菜花蕾进行转录组测序分析,并挖掘与蜡粉合成相关基因,为探明青花菜花球表面蜡粉形成的分子机制提供理论参考。【方法】分别提取野生型和蜡粉缺失型青花菜花球总RNA,采用Illumina HiSeqTM 2500平台进行转录组测序,获得高质量Clean reads,采用Trinity进行序列组装后获得青花菜Unigene库,将获得的Unigene序列与Nr、Nt、KEGG、Pfam、KOG/COG、Swiss-Prot和GO数据库比对,获得基因功能注释信息;使用DESeq2进行差异表达分析。【结果】共获得44.68 Gb Clean data,De novo组装得到41244条Unigenes,N50长度为1847 bp。从所获得的Unigenes中筛选出8685个差异表达基因(DEGs)(上调基因5747个,下调基因2938个),共有8038个基因被注释到不同数据库,其中,5220个基因注释到Pfam数据库; 2066个基因注释到COG数据库,3866个基因注释到KOG数据库; 2580个差异表达基因被注释到75个转录因子家族中,注释最多的是MYB家族(235个);GO数据库中6095个差异表达基因注释到细胞组分、分子功能和生物学过程三大类的52个功能分类; KEGG数据库中,1671个差异表达基因富集到138条代谢通路,其中13个差异表达基因与脂肪酸合成有关,7个差异表达基因与蜡粉生物合成途径有关。【结论】转录因子MYB家族在调控青花菜蜡粉合成中发挥重要作用。蜡粉合成过程中相关酶基因的差异表达是调控青花菜蜡粉合成的关键,尤其是野生型和蜡粉缺失突变体中特异性表达的差异表达基因,可作为后续研究青花菜花球表面蜡粉形成分子机制的对象。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号