首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
采用Illumina测序技术对在醋酸钙、硫酸铵和蔗糖处理后蓝莓不同发育阶段的果实进行转录组测序,获得Clean Reads 2723731442条,经组装得到平均长度为753.65 nt的87608条Unigene。将转录组Unigene进行基因功能注释,其中39867条Unigene能被NR数据库注释,与葡萄同源序列最多,占8.58%;与GO数据库比对发现,有29661条Unigene获得注释,分别匹配到生物过程、细胞组成和分子功能三大类共59个分支;与KOG数据库进行比对,发现有21992条Unigene具有功能信息,分别涉及25类;根据KEGG数据库的注释信息进行Pathway注释,参与的代谢通路共有246条;共检测到8704个SSR位点,其中双碱基重复的SSR占78.57%。本研究为探索外源物质调控蓝莓果实生长发育、生理代谢的分子机理提供了理论基础。  相似文献   

4.
大花序桉(Eucalyptus cloeziana)是中国重要用材林树种,但目前对其生物信息学研究缓慢,在一定程度上限制了大花序桉分子育种以及品种改良。采用Illumina Hi Seq TM 2000高通量测序平台对1年生大花序桉根系转录组测序和de novo组装,将得到的Unigene与公共数据库比对,同时进行转录组分析。结果显示,组装获得53 433条Unigene,其平均长度890 bp,N50长度为1 587 bp;有34 700条Unigene获得注释信息,占全部Unigene的64.94%,其中19 327条Unigene注释到KOG数据库,被分到25个类别中,共得到32 302个KOG功能注释信息;有11 197条Unigene注释到GO数据库中,共获得了54 971个GO注释功能,归于细胞组分、分子功能和生物学过程三大类;有12 181条Unigene得到KEGG注释,其中6 493条Unigene归入128条代谢途径,发现有57条Unigene参与氮代谢途径。通过软件查找获得13 290个SSR位点,二核苷酸重复类型占的频率最高,其次是三核苷酸、四核苷酸和六核苷酸,五核苷酸重复频率最低。本研究首次对大花序桉转录组进行分析,为深入开展大花序桉分子生物学研究提供基础数据来源。  相似文献   

5.
《分子植物育种》2021,19(16):5342-5351
为了获得珍贵用材树种大花序桉顶芽转录组数据及预测关键基因功能,本研究基于Illumina HiSeq X Ten测序技术获得大花序桉顶芽转录组原始数据,经Trinity组装拼接获得高质量Unigene,并与NR、Swiss-Prot、GO、KOG、egg NOG和KEGG等生物信息数据库进行序列比对和功能注释,利用MISA软件进行SSR位点搜索和分析。从大花序桉顶芽中共获得26 587条高质量Unigene,平均长度为1 279.69 bp;共有22 099条Unigene至少在一个数据库中被成功注释,其中,11 507条Unigene被注释到KOG数据库中25个功能类别,以参与一般功能基因的数量最多;GO数据库中,所注释到的14 105条Unigene分别匹配到生物功能、细胞组分和分子功能3大类50个功能基因区,其中执行生物过程所占比例最多;KEGG功能注释共发现有7 117个Unigene参与127条代谢通路,以代谢相关的基因最丰富;共有1 021条Unigene注释到转录因子数据库,分布于65个家族,其中比例最大的是bHLH和MYB家族;3 274条Unigene注释到植物抗性基因数据库,分布于13个类别,相匹配基因数量最大的是RLP和TNL。MISA软件共检测到12 366个SSR位点,分布密度为1/2.75 kb,重复基元类型丰富,标记开发潜力大。本研究利用高通量测序获得丰富的顶芽转录组信息,可以为大花序桉分子辅助育种提供丰富的资源。  相似文献   

6.
本研究利用Illumina HiSeq~(TM)2000对马蓝转录组进行高通量测序,使用软件MicroSAtellite (MISA)分析转录组中的SSR位点信息。通过组装马蓝转录组数据获得了51 381条Unigene,并对获得的Unigene进行SSR检测,共检测到8 471个SSR位点,其分布在6 782条Unigene中,出现的频率为16.49%。SSR中以二核苷酸和三核苷酸重复类型为主,其中二核苷酸以重复单元AT/TA为主,占18.14%,其余类型的重复单元相对较少。SSR所在序列功能注释结果显示在Nr和SwissProt中分别有5 932和4 285条序列被注释,同时SSR所在序列还被注释到47个GO分类,25个KOG分类和29个KEGG代谢通路中。通过设计、筛选,共获得5 819对引物组合,随机挑选的18对引物中有13对引物扩增出符合预期大小的条带。马蓝SSR出现的频率高,重复种类丰富,为研究马蓝遗传多样性、基因定位和品质改良等提供了科学依据。  相似文献   

7.
白芨转录组特性分析   总被引:1,自引:0,他引:1  
白芨(Bletilla striata)具有较高的药用、经济和观赏价值,但是其基因组和转录组序列未知,严重影响了其的研究开发和利用。本研究采用His4000测序平台对白芨的全株进行了转录组测序分析,共获得原始数据6.8 G,有效数据6.7 G,243 410条Unigene,经过与NR、GO、KOG及KEGG等数据库进行比较分析后,83 541条Unigene被注释到NR数据库,50 178条Unigene被注释到GO数据库,10 007条Unigene在KOG数据库获得注释,43 637条Unigene在Swissprot数据库获得注释,15 321条被注释到KEGG代谢途径中,2 021条Unigene参与了糖类代谢,1 309条Unigene参与了氨基酸合成和代谢,120条Unigene参与了萜类合成,106条转录因子与代谢相关;微卫星位点有31 958个,其中单核苷酸最多,15 709个,占49.16%,其次为二核苷酸和三核苷酸,分别有9 145个和7 104个,占28.62%和22.23%。本研究为白芨的重要功能基因挖掘、遗传育种及其研究开发提供了参考和依据。  相似文献   

8.
为了进一步阐明广藿香中药用活性成分生物合成的分子机制,本研究以海南广藿香幼叶及成熟叶片为材料,采用BGISEQ-500高通量测序平台进行转录组测序,分别获得了63 751 826条和65 949 390条clean reads,平均读长为90 nt。De novo组装后将All-unigene分别注释到Nr、KOG、GO、KEGG、Swiss-Prot、Inter Pro数据库,对每个数据库注释的Unigene数目进行统计,共有162 509条Unigene有对应的功能信息,其中105 430条Unigene被注释到Nr数据库,显示与芝麻有69.87%的相似度;有83 369条Unigene被注释到KOG数据库,根据功能将其分为25类;有12 261条Unigene与GO数据库中的基因具有相似性,将其归为3大类中49个功能组;有79 053条Unigene被注释到KEGG的代谢通路中,分属于124类代谢通路,包括次生代谢物质生物合成、倍半萜和三萜类化合物生物合成、黄酮和黄酮醇生物合成、花青素生物合成等。该研究结果对广藿香药用活性成分生物合成与代谢、关键酶基因克隆以及分子标记开发等研究有一定的帮助。  相似文献   

9.
为了开发马尾松SSR标记,本研究利用MISA软件对马尾松转录组测序获得的148 186条Unigene (序列总长约91 449.7 kb)进行全面分析,共搜索获得6 611个SSR位点,分布在6 003条Unigene上,SSR发生频率为4.05%,平均每13.83 kb出现1个SSR,结果发现单核苷酸重复出现的频率占总SSR的53.60%;二核苷酸为23.46%;三核苷酸为21.33%。通过对含SSR的Unigene的GO分析,显示生物过程包含的Unigene占40.60%;细胞组分包含的Unigene占35.45%,分子功能包含的Unigene占23.95%;转录组中有724个Unigene可被注释到110个KEGG通路中,其中被注释到新陈代谢的Unigene最多有312个,其次是遗传信息处理类有183个。根据含SSR的Unigene序列共设计了4 247对SSR引物,并随机挑选30对SSR引物进行PCR扩增验证,其中12对引物能够扩增出目标条带,引物的有效性为40%。本研究结果表明,马尾松转录组测序获得的Unigene序列可作为SSR标记开发的有效来源,所开发的SSR标记为马尾松的遗传图谱构建、分子标记辅助育种等研究提供丰富可靠的标记。  相似文献   

10.
本研究基于RNA-Seq技术建立了一个由3个甘蔗原始亲本和8个不同来源的甘蔗栽培品种/系构成的甘蔗参考转录组,并进行生物信息学相关分析。研究结果表明:对供试材料+1叶RNA混合样本进行转录组测序,可组装出98 945条Contig,从中找到5 806个SSR位点,其中三核苷酸重复最多、六核苷酸重复最少,CCG/CGG出现的频率最高。进一步处理Contig获得75 656条Unigene,将所有的Unigene与Nr数据库、Swiss-Prot数据库、KEGG数据库和COG数据库进行Blast,有53 951条Unigene得到注释。在Nr和KEGG注释结果基础上,对Unigene进行GO和KEGG功能分类,分别获得44个功能小组和123个Pathway注释。研究结果可为研究甘蔗在不同时空条件下的差异基因表达奠定基础。  相似文献   

11.
扁秆荆三棱是一种常见的稻田杂草,旨在补充其转录组信息,为相关防治工作提供支持。基于高通量测序技术,在Illumina Solexa HiSeq 2000平台上对扁秆荆三棱的茎、叶、根茎和球茎的混合样品进行转录组分析。经拼接组装共获得了59 788个Unigene,序列的平均长度842 bp,N50为1 402 bp。将获得的Unigene与5个通用公共数据库(NR、 Swiss-Prot、 KEGG、 GO、 KOG)进行比对(Evalue1e-5),35 221条Unigene获得了基因注释,占总Unigene的58.91%。在12 823个Unigene中共搜索到9 698个SSR位点,其中二核苷酸和三核苷酸的重复类型占所有SSR位点的95.93%。通过KEGG pathways分析,共有13 141个Unigene参与了291个代谢通路,获得了扁秆荆三棱淀粉合成功能相关Unigene 60个,根茎生长功能相关Unigene 14个。其中赤霉素相关基因、核糖体代谢通路等反映了地下根茎网络系统的扩张趋势以及活跃的能量需求,淀粉合成基因则说明其球茎中的营养储备开始于地下系统扩张的早期,这些发现为深入研究地下根茎网络调控机制,或杂草防治或湿地保护等实践工作提供了参考。  相似文献   

12.
井赵斌 《分子植物育种》2021,19(6):1830-1838
为了发掘中国野生猕猴桃资源抗溃疡病基因,利用Illumina HiSeq测序平台对不同时间接种溃疡病菌的毛花猕猴桃进行mRNA高通量测序。结果表明,共获得68731个Unigene,其中有48414个基因注释到Nr、SwissProt、KEGG和COG/KOG数据库。KOG注释显示,通用功能预测、转录后修饰、蛋白代谢、伴侣蛋白、信号转导机制,翻译、核糖体结构和生物合成所占比例最高;GO注释表明参与生物过程的差异表达基因数目最多,细胞组分和分子功能次之;KEGG通路分析表明差异基因的富集以生物合成和代谢为主。接种后不同时间点共获得63050个差异表达基因。通过SSR位点分析,从68731个Unigene中鉴定出13652个SSRs位点;同时获得了各类型转录因子1580个;R基因3727个。本研究结果对猕猴桃抗溃疡病基因发掘和抗溃疡病新品种选育具有重要的理论指导和育种实践意义。  相似文献   

13.
以南酸枣雌株叶片和成熟果实为材料,利用Illumina Hi Seq TM 4 000测序平台对其转录组进行测序,共获得14.15 G有效数据,通过序列拼接组装得到46 936条Unigene,平均长度为1 287 bp。36 299条Unigene(77.33%)在7大数据库(NR,NT,KO,Swiss-Prot,PFAM,GO和KOG)中得到注释,其中与GO数据库比对上的26 014条Unigene可分为生物过程、细胞组分和分子功能3大类53分支,注释到KOG数据库中的8 459条Unigene依据功能可分为25类。与KEGG数据库比对,6 225条Unigene分属5大类246条代谢通路中。南酸枣叶片和果实转录组中共发现5 631个差异表达基因,包括1 930个上调基因和3 701个下调基因。本研究获得的转录组数据将有助于开展南酸枣功能基因挖掘与利用、分子辅助育种和其种质资源遗传改良等方面的研究。  相似文献   

14.
本研究采用Illumina高通量测序技术对3种不同倍性的桤木属植物混合样品进行转录组测序,利用生物信息学方法开展基因表达谱的研究、功能基因的预测。测序结果组装获得85 769个Unigene,总长50 200 910 bp,功能注释到NR、NT、Swiss-Prot、KEGG、COG、GO库的Unigene分别是45 172、38 673、29 181、25 096、14 968和30 675个,所有注释上的Unigene是48 204个。根据KEGG pathway数据库,对桤木转录组的Contig进行pathway生物学通路的注释和预测,共识别出25 096个Unigene具有对应的功能,并关联到128条生物学通路。SSR查找发现,从85 769个Unigene中找到8 678个SSR位点,占Unigene总数的比例为10.11%。其中,二核苷酸重复所占比例最高,达到65.87%,其次是三核苷酸重复,为28.36%,四、五、六核苷酸重复类型的数量很少,总计5.77%。SSR不同重复单元类型中,出现频率最高的为AG/CT,其次是AAG/CTT和AT/AT。  相似文献   

15.
为了研究牡丹、芍药远缘杂交胚败育的分子机理,本研究使用BGISEQ-500平台对牡丹、芍药杂交种胚转录组进行测序,通过测序,共得到了92.02 Gb数据。通过拼接组装去冗余后得到了86 195个Unigene,平均长度为1 189 bp。86 195个Unigene在七大功能数据库中进行注释,最终分别有49 172 (NR:57.05%)、38 352(NT:44.49%)、36 477 (Swiss Prot:42.32%)、38 905 (KOG:45.14%)、37 993 (KEGG:44.08%)、26 832 (GO:31.13%)以及37 758 (Pfam:43.81%)个Unigene获得功能注释。同时还检测出21 998个SSR分布于17 567个Unigene中,其中二核苷酸和三核苷酸这两种重复类型分别有5 628个和2 906个。在17 567个Unigene中预测出1 671个编码转录因子。不同发育时期的胚转录组数据中共筛选出13 974个差异表达基因,其中上调基因有8 647个,下调基因有5 327个。该转录组测序分析为寻找牡丹、芍药远缘杂交胚败育相关基因提供了一定的理论参考。  相似文献   

16.
为了深入了解文冠果转录组的整体水平及脂肪酸合成与代谢相关功能基因的表达情况,本研究以文冠果根、茎、叶、花为材料利用Pacific Biosciences RS II平台测序技术进行测序及生物信息学相关分析。平台共获得原始数据7.64 Gb,生成110 584个转录本,平均长度为1.9 kb。对所有转录本在NR、SwissProt、KEGG、KOG、GO、NT、pfam数据库进行注释和功能分类,结果共得到102 118个注释基因,占比92.34%。共有351个参与脂肪酸生物合成和120个参与脂肪酸延长的Unigene,分别编码15个脂肪酸生物合成和7个脂肪酸延长的关键酶。同时在110 584条Unigene中分析发现了94 906个SSR位点,单核苷酸重复频率最高(68.29%),并预测了6 059个转录因子(TFs)。与第二代测序(Roche 454 de novo)结果相比,PacBio平台所得到的转录本更长,转录本注释率也得到提高。本研究为文冠果的下一步分子生物学研究提供了较为可靠的转录组数据。  相似文献   

17.
为揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,本研究以盐胁迫处理的露地菊及其对照为材料,使用Illumina Hiseq2500高通量测序平台对转录组进行测序,分别获得了60370448和71415448条Clean reads,通过序列拼接组装得到45591条Unigene,平均长度724 bp。有37675条Unigene在七大数据库(COG,GO,KEGG,KOG,Pfam,Swiss-Prot,NR)中得到注释。通过比对露地菊盐胁迫处理组和对照组样品间Unigene的表达量及在各数据库中的注释情况,统计得到:有4143条差异表达基因获得注释;有2441条差异表达基因在GO数据库中获得功能注释;注释到COG数据库中的2281条差异表达基因依据功能可分为25类;有1062条差异基因映射到KEGGPathway数据库中,涉及了199个代谢通路,包括核糖体途径、植物激素信号传导途径、淀粉蔗糖代谢、碳代谢、氨基酸的生物合成等。本研究获得的转录组数据将有助于揭示露地菊生长发育及耐盐胁迫的应答机制和分子基础,及相关抗性基因的挖掘和分子辅助育种等方面的研究。  相似文献   

18.
印度野牡丹(Melastoma malabathricum)属于野牡丹科野牡丹属,是双子叶有花植物,具有优良的观赏价值和药用价值,在未来的城乡绿化中具有较大的应用潜力和景观贡献力。本研究以粉色和白色的印度野牡丹为材料,采用RNA-seq转录组测序获得54 725条Unigene,并分别通过Nr、SwissProt、KOG和KEGG 4个数据库分别进行同源比对和功能注释,其中有11 319条Unigenes在4个数据库中都注释到了相应的功能基因。GO注释到123 355个Unigenes分为3个本体49个功能组,KEGG注释到7 880条Unigenes涉及129种代谢途径,其中部分Unigene涉及花色素合成途径、类黄酮合成途径、类胡萝卜素等合成途径。这些研究结果为后续深入开展印度野牡丹花青素等物质代谢合成途径及相关基因研究奠定基础。  相似文献   

19.
为了丰富紫花槭转录组数据,进一步开展紫花槭秋季叶片呈色机制研究.本研究以紫花槭秋季转色期三个阶段(前期,中期,后期)叶片为材料,采用高通量测序技术进行转录组初步分析.转录组数据共获得50501条Unigene,有35316条Unigene在数据库中得到注释,其中NR数据库中注释到的Unigene数量最多,共35024条,占69.4%.在注释到的物种中,紫花槭比对的Unigene与甜橙(Citrus sinensis)相似度最高,共有4290条,占12.25%.紫花槭转录组中的Unigene根据GO功能可分为生物学过程、细胞组分和分子功能3大类,共有25375条,其中生物学过程的基因最多,主要聚集于代谢过程和细胞过程等.基于Unigene库的基因结构分析,其中SSR分析共获得12711个SSR标记,占Unigene总数的36%.SSR位点共包含150种重复基元,单碱基重复所占比例最高(7184个,61.86%),四碱基重复、五碱基重复和六碱基重复所占比例较低.Unigene库中共有328239个SNP位点,发生频率为1/190 bp,SNP位点分为转换和颠换两种类型的碱基替换方式,其中碱基转换位点213787个(65.13%),碱基颠换位点114452个(34.87%),碱基转换类型发生频率高于颠换类型.6种单碱基变异中,2种转换类型A/G、C/T的发生频率分别为33.03%和32.10%;4种颠换类型中A/T发生频率最高,为11.52%;C/G发生频率最低,为5.79%.紫花槭转录组秋季叶色表达的转录组分析,可为紫花槭叶色基因调控、定向分子育种和培育彩叶新品种提供研究提供基础的数据信息.  相似文献   

20.
《种子》2021,(5)
为了更好地认识长瓣兜兰,并开发其园艺价值,以长瓣兜兰花器官为材料,利用RNA-seq技术对长瓣兜兰花蕾和花朵进行转录组测序。结果表明,共获得95 659条unigene。将unigene比对到NR、KOG、Swissprot、KEGG等数据库进行注释,共发现有61 629条unigene得到注释,占全部unigene的64.43%。长瓣兜兰转录组unigene在CDD、KOG、NR、NT、PFAM、Swissprot、TrEMBL、GO、KEGG等数据库中被注释的基因数目分别为33 589、28 405、45 568、56 635、23 870、52 141、44 973、54 934、4 893。注释结果显示,长瓣兜兰与油棕同源的序列最多。GO注释中可将其分成3大类71个小组,KOG数据库注释可将其分成25个功能类别;根据KEGG注释和通路富集结果,共有4 893条unigene参与了23类327个代谢途径。经MISA软件对unigene进行SSR检测,发现在95 659条unigene中有7 613条有SSR,共搜索到8 160个SSR位点,其长度范围分布在10~230 bp之间,平均长度为66.95 bp。SSR丰富度最高的是二核苷酸,占比为33.72%,其次为一核苷酸和三核苷酸,分别占比32.12%和26.11%。本研究通过对长瓣兜兰进行转录组测序,获得了大量基因序列,了解了长瓣兜兰花器官基因的大致表达情况,为长瓣兜兰花器官发育相关基因的发掘与利用、SSR分子标记的开发以及其基因组的测序与组装提供了参考,也为后续在分子生物学层面对长瓣兜兰开展深入研究奠定基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号