首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
《山西农业科学》2016,(8):1065-1072
采用高通量测序技术对黄芩的转录组进行测序,获得了29 099 899条reads数据,拼接后得到53 353条Unigene;将所获得的Unigene与COG,GO,KEGG,Swiss-Prot,NR这5个公共数据库进行比对,结果发现,分别有10 756,21 950,8 101,20 339,29 288条Unigene可比对到以上5个数据库中;已注释的Unigene与COG数据库比对后按功能可分为25类;根据GO功能可分为三大类57个亚类;经过与KEGG数据库比对后按照代谢通路可分为116类;利用Get ORF软件进行ORF预测,获得长度大于300 nt的ORF共20 552个;通过SSR分析,共获得5 658个SSR标记。获得的转录组信息可为今后进行黄芩分子标记的开发和关键基因的克隆及功能分析等研究提供基础数据。  相似文献   

2.
[目的]利用高通量测序技术解析红脚艾(Artemisia rubripes Nakai)的转录组信息特征.[方法]通过高通量测序平台Illumina HiSeq 2500对红脚艾进行转录组测序,通过Trinity软件de novo组装获得Unigene,并基于序列同源性对Unigene进行功能注释,得到红脚艾的转录组信息.[结果]测序数据经过质控后共获得24126043条高质量的reads,通过de novo组装获得173093个转录本,对组装的转录本去冗余后共获得85991个Unigene,平均长度为616.87 bp,N50为925 bp.共有47216个Unigene在NR、KEGG、COG、KOG、GO数据库获得功能注释,40802个Unigene在NR数据库注释,显示红脚艾与向日葵(Helianthus annuus)的单基因匹配率最高,16846个Unigene被KEGG数据库注释到130条代谢途径中,26171个Unigene被注释到25个KOG功能分类中,23203个Unigene被GO注释到生物过程、细胞组成和分子功能三大类51个功能分类,12810个Unigene被注释到25个COG功能分类中.[结论]利用高通量测序技术获得了红脚艾转录组信息特征,这些数据将为后期开展功能基因鉴定、解析化合物次生代谢途径及其调控机制奠定研究基础.  相似文献   

3.
以10年以上树龄的杜仲雌株当年新发枝条上的幼果、嫩芽、叶片和树皮和雄株新发枝条上嫩芽、叶片和树皮为材料,采用Illumina Hi SeqTM2000高通量测序技术进行转录组测序,获得雌株51,574,000条、雄株52,430,502条Clean Reads数据,分别包含总长度为4,641,660,000nt和4,718,745,180nt核苷酸序列数据信息;经拼接组装,获得雌株基因信息长达69,461,730nt的423,339个Contig片段,获得雄株基因信息长达94,814,201nt的542,383个Contig片段;经进一步拼接,分别获得平均长度为288nt的雌株159,434个Unigene片段和平均长度为231nt的雄株257,288个Unigene片段,共有48,761个表达序列标签(EST)。以BLAST(E-value1.0E-5)将Unigene对NR、NT、KEGG和COG数据库进行比对,获得CDS序列35,541条,再通过ESTscan分析获得CDS片段13,220条,共获得48,761条CDS片段。与NR数据库比对发现杜仲雌、雄株转录组Unigene与葡萄相似序列最多(33.8%),其次是蓖麻(11.4%)和杨树(11.2%),与拟南芥的相似序列仅2.3%;根据Unigene与COG数据库比对结果,可将有COG功能的7,571条Unigene分为24类,而根据GO数据库注释,杜仲转录组有GO功能注释的23,314条Unigene可分为生物过程、细胞组分和分子功能3大类55分支。与KEGG数据库比对,杜仲雌、雄株转录组17,468条Ungenes分属128类代谢通路,其中有2,399条属于次生物质代谢途径,314条参与萜类化合物生物合成途径。  相似文献   

4.
香榧具有重要的经济价值,但其基因组信息相对匮乏,限制了其分子生物学和基因功能的研究。本文以不同组织的香榧作为研究对象,采用新一代高通量测序技术平台Illumina Hi Seq?2000对香榧转录组进行测序和数据分析,共得到37,349,086个reads片段,总碱基数为4.35 G。利用组装软件,对获得的高质量序列进行组装,共得到104,636个Unigene,平均长度为784 nt,N50为1,702。将Unigene序列与公共数据库进行比对,28,766个Unigenes获得了注释。其中26,856个Unigene在NR蛋白数据库中获得注释,24,003个Unigenes在NT数据库中获得注释,21,401个Unigene在Swiss-Prot蛋白数据库中获得注释,16,137个Unigene在COG数据库中获得注释,11,410个Unigene在GO数据库中获得注释。根据KEGG注释信息,18,564个Unigene被划分到256个代谢途径中。SSR位点搜索发现,在4,217个Unigene中含有4,706个SSR位点。分析所获得的转录组数据,将为香榧功能基因的克隆,基因的表达,指纹图谱构建和分子标记辅助选育奠定基础。  相似文献   

5.
【目的】为发掘和研究红螯螯虾功能基因SSR标记奠定基础。【方法】对红螯螯虾肝脏、精巢以及卵巢转录组测序选用新一代高通量测序技术Illumina Hi Seq 2000,同时借助生物信息学法展开基因表达谱探究及功能基因预测。【结果】肝脏组织获得47 629 414条clean reads,精巢组织获得47 018 968条clean reads,卵巢组织获得53 267 362条clean reads。所有reads组装后获得了67 369个Unigene。通过GO分类,16 989个Unigene被分为3个种类,即生物学过程、细胞组分、分子功能。通过COG分类,4 697个Unigene被分为25个种类。通过KEGG分类,9 842个Unigene分属331个代谢途径。【结论】通过对红螯鳌虾肝脏等3个组织转录组的测序,获得了其相关基因的表达图谱及其功能分类。  相似文献   

6.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

7.
为进一步开发大竹蛏Solen grandis的基因资源,采用2代Illumina Hi-seq测序技术对大竹蛏的鳃组织进行了转录组测序,构建了转录组数据库,获得338 483 476条Clean Reads数据;拼接组装后获得190 856条Unigene数据,平均长度为1147 bp;与NR、NT、KO、Swiss Prot、PFAM、GO、KOG等数据库进行Blast信息比对(E-value为10-5),共获得63 337个注释基因;与NR数据库比对发现,大竹蛏转录组基因序列与长牡蛎Crassostrea gigas具有较高的同源性,为53.3%;将大竹蛏转录组的Unigene的功能通过与KOG数据库进行注释比对划分为25类;GO数据库注释可分为三类,即细胞组分、生物过程和分子功能,共包括65个分支;KEGG分析发现,大竹蛏转录组数据中按照代谢通路可分为92类,利用Blast蛋白库比对和Estscan软件进行ORF预测,获得长度大于300 nt的ORF共50 681个;通过SSR分析,共获得73 089个SSR标记。本研究中获得的转录组信息可为今后进行大竹蛏分子标记的开发和关键基因的克隆及功能分析等研究提供基础数据。  相似文献   

8.
【目的】开展荸荠球茎发育过程转录组测序研究,为研究荸荠球茎发育过程相关基因表达信息提供参考。【方法】运用高通量测序技术,对荸荠球茎不同发育时期进行转录组测序研究。【结果】组装共得到223 182条转录本和90 542条Unigene,平均长度为809 bp,N50为1119。组装完整性较高,效果较好。对所得Unigene进行不同数据库注释,共有50 583条Unigene成功注释到7个数据库(NR、GO、NT、Pfam、KEGG、KOG及Swiss-prot)。对差异表达基因分析,发现球茎膨大初期的差异表达基因数目最多,为最活跃阶段。GO功能富集分析结果表明,33 205个基因获得功能注释,分为分子功能、细胞组分和生物学过程等3大类和54个亚类。COG功能分类结果表明,17 743个基因分布于25个功能区域,其中碳水化合物代谢占重要地位。KEGG代谢通路注释结果表明有20 667个基因获得功能注释,共有116条代谢途径,其中淀粉-蔗糖代谢占主要作用。【结论】利用高通量转录组测序技术首次建立了荸荠优良品种‘桂蹄3号’球茎的转录组数据库,为进一步研究荸荠球茎淀粉生物合成相关基因的功能及形成的分子机制提供了数据基础。  相似文献   

9.
泸定百合是非常优良的种质基因资源,鳞茎研究是其科研和生产的关键环节,然而泸定百合鳞茎的分子生物学研究尚属空白。为揭示泸定百合鳞茎的分子机制,应用高通量测序技术对泸定百合的鳞茎进行转录组分析。原始数据经过生物信息学分析后,共获得4.9 G有效数据,43 412条Unigene;所获得的Unigene与NR,GO,COG和KEGG等数据库进行搜索比对后,发现有30 225条和21 531条Unigene分别获得NR和GO注释,14 069条Unigene得到COG注释,GO注释中获得374条Unigene可能作为转录因子参与泸定百合鳞茎的形成与发育;共有10 822条Unigene参与了KEGG代谢途径,其中有571条Unigene注释到次生代谢合成途径,其中66条和23条Unigene分别参与了萜类和生物碱的合成。研究结果为采用生物技术手段提高百合的药用成分的含量及改善其园艺性状积累了基本资料。  相似文献   

10.
【目的】对青花菜花蕾进行转录组测序分析,并挖掘与蜡粉合成相关基因,为探明青花菜花球表面蜡粉形成的分子机制提供理论参考。【方法】分别提取野生型和蜡粉缺失型青花菜花球总RNA,采用Illumina HiSeqTM 2500平台进行转录组测序,获得高质量Clean reads,采用Trinity进行序列组装后获得青花菜Unigene库,将获得的Unigene序列与Nr、Nt、KEGG、Pfam、KOG/COG、Swiss-Prot和GO数据库比对,获得基因功能注释信息;使用DESeq2进行差异表达分析。【结果】共获得44.68 Gb Clean data,De novo组装得到41244条Unigenes,N50长度为1847 bp。从所获得的Unigenes中筛选出8685个差异表达基因(DEGs)(上调基因5747个,下调基因2938个),共有8038个基因被注释到不同数据库,其中,5220个基因注释到Pfam数据库; 2066个基因注释到COG数据库,3866个基因注释到KOG数据库; 2580个差异表达基因被注释到75个转录因子家族中,注释最多的是MYB家族(235个);GO数据库中6095个差异表达基因注释到细胞组分、分子功能和生物学过程三大类的52个功能分类; KEGG数据库中,1671个差异表达基因富集到138条代谢通路,其中13个差异表达基因与脂肪酸合成有关,7个差异表达基因与蜡粉生物合成途径有关。【结论】转录因子MYB家族在调控青花菜蜡粉合成中发挥重要作用。蜡粉合成过程中相关酶基因的差异表达是调控青花菜蜡粉合成的关键,尤其是野生型和蜡粉缺失突变体中特异性表达的差异表达基因,可作为后续研究青花菜花球表面蜡粉形成分子机制的对象。  相似文献   

11.
基于RNA-Seq技术的鲮转录组分析   总被引:1,自引:0,他引:1  
为满足标记辅助育种的要求,通过454测序平台首次开展了鲮Cirrhina molitorella全鱼转录组深度测序,并用 Newbler 等软件进行数据精细分析。结果表明:共获得了1297479条 reads,总碱基数为486586191 bp,组装后得到19962条contigs,平均长度为1269 bp, N50为1509 bp。基因功能注释研究共获取了10577个特异蛋白,根据特异蛋白注释结果进行GO分析,有7314条contigs有GO注释,包含5381个特异蛋白;采用GO 功能分类工具可将已注释转录物序列划分为分子功能、生物途径和细胞成分3类,为下一步开展生长等性状相关基因功能验证研究提供丰富的序列资源;共鉴定出5931个具有完整的ORF的全长cDNA序列,并且鉴定出2438个微卫星和5014个SNP位点。本研究中,还建立了鲮转录组数据库和网站,方便同行随时调取数据,这为深入开展鲮分子标记辅助的遗传育种、种群遗传学和资源评估等研究提供了丰富的标记资源。  相似文献   

12.
为获得岩原鲤转录组信息,发掘功能基因,本研究采用Illumina高通量测序技术对岩原鲤全组织转录组进行测序。结果获得64 257 918个EST序列,经拼接和组装得到83 252条单基因序列(unigene),平均长度787 bp,长度范围201~16 572 bp。利用NCBI的蛋白质非冗余数据库(Nr)对所有unigene进行相似性搜索,共有37 157条unigene(44.63%)与数据库中的已知序列同源。利用Blast2GO v2.5软件对unigene进行注释,共得到29 919条(35.93%)注释基因,根据GO功能分类将其分为生物过程、细胞组分和分子功能3大类56亚类。经KOG注释及分类,共有17 869条(21.49%)unigene成功注释到真核直系同源组中,并将其分为26个功能组分。经KEGG代谢通路分析可分为5大类(细胞过程、环境信息处理、遗传信息处理、代谢和有机系统)32小类共267个代谢通路。本研究通过高通量测序技术,对岩原鲤转录组进行测序,获得了大量的转录组信息,为岩原鲤功能基因克隆及基因组学研究提供了基础。  相似文献   

13.
为探究磷脂酶基因家族在百合叶片中的表达情况,利用Illumina测序对百合正常叶片和叶烧病叶片进行转录组测序分析.测序共获得磷脂酶注释基因274个,分为PLA1、PLA2、PLB、PLC和PLD共5类.在KEGG、NR、COG和Swiss-prot等4个蛋白质数据库中都注释为磷脂酶基因的Unigene序列有34条,其中...  相似文献   

14.
基于边合成边测序( Sequencing By Synthesis ,SBS)技术,使用Illumina HiSeq2500高通量测序平台对长白落叶松cDNA文库进行测序。共获得非重复序列基因58683条,总长度为55283938 bp。将得到的转录本使用BLAST软件将非重复序列基因序列与NR、Swiss-Prot、GO、COG、KEGG数据库比对,通过选择BLAST参数E-value不大于10-5,最终获得29350个有注释信息的基因序列,其中19292个转录本注释GO编号,有9112个转录本在COG数据库中被注释并分为25个功能分类,同时注释到120条KEGG代谢途径。在得到注释的转录本中搜索到木质素相关基因共68条,其中与木质素合成相关基因29条,与木质素分解代谢相关基因27条;找到了147条纤维素相关基因,其中与纤维素合成相关基因103条,与纤维素分解代谢相关基因44条。  相似文献   

15.
基于边合成边测序(Sequencing By Synthesis,SBS)技术,使用Illumina Hi Seq2500高通量测序平台对长白落叶松c DNA文库进行测序。共获得非重复序列基因58 683条,总长度为55 283 938 bp。将得到的转录本使用BLAST软件将非重复序列基因序列与NR、Swiss-Prot、GO、COG、KEGG数据库比对,通过选择BLAST参数Evalue不大于10-5,最终获得29 350个有注释信息的基因序列,其中19 292个转录本注释GO编号,有9 112个转录本在COG数据库中被注释并分为25个功能分类,同时注释到120条KEGG代谢途径。在得到注释的转录本中搜索到木质素相关基因共68条,其中与木质素合成相关基因29条,与木质素分解代谢相关基因27条;找到了147条纤维素相关基因,其中与纤维素合成相关基因103条,与纤维素分解代谢相关基因44条。  相似文献   

16.
【目的】获得冬瓜转录组序列、遗传变异等信息,从中挖掘冬瓜基因数据及SSR分子标记,为冬瓜后续研究提供数据支撑。【方法】以冬瓜嫩叶为材料,利用Illumina HiSeq~(TM)2000技术对冬瓜进行转录组测序,构建数据库从中获得干净序列。经De novo拼接组装后,将获得的单基因簇(Unigene)数据在非冗余蛋白数据库(nonredundant protein database,Nr)、蛋白质序列数据库(Swiss Prot protein database,Swiss Prot)、基因本体论数据库(gene ontology,GO)、蛋白质真核同源数据库(eukaryotic orthologous groups,KOG)、东京基因与基金组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)、蛋白质家族域数据库(protein families database,Pfam)6个公共数据库中进行比对,最终得到冬瓜单基因簇注释信息。利用MISA软件对转录组单基因簇进行搜索,获得单基因簇中的SSR位点。【结果】从冬瓜嫩叶中得到62 021 032条高品质序列,组装后获得40 611条单基因簇,平均长度955 bp。将所有单基因簇在Nr和Swiss Prot数据库中进行比对,结果分别比对到27 474及19 573条单基因簇;在GO数据库中,所注释到的10 659条单基因簇分别匹配到生物功能、分子功能和细胞组分3个本体的47个功能组中;与KOG数据库进行注释比对,根据其功能将注释到的单基因簇划分为25类;KEGG数据库比对注释到10 799条冬瓜的单基因簇,可分为5个大类、19个亚类、125条代谢途径;在Pfam数据库中比对到17 990条单基因簇,分属于369个类群。SSR位点搜索发现,有5 086条单基因簇包含SSR序列,获得5 474个SSR位点。【结论】利用高通量测序获得大量冬瓜转录组信息,有助于从分子水平对冬瓜进行深入研究。  相似文献   

17.
金钱松是中国特有的孑遗单种属裸子植物,现存的自然种群数量很少,多被引种栽培,也是著名的庭院观赏树种。迄今为止,其遗传背景和基因组信息并不清楚,对于金钱松的保护及其遗传结构研究迫切需要基因组资源。采用Illumina HiSeqTM2500高通量测序平台对金钱松叶片进行转录组测序,经de novo组装共获得70 761条Unigene,平均长度为699 bp,N50的长度为1 300 bp,Q20和Q30序列分别占96.59%和91.29%。通过对7个不同的蛋白质和功能域数据库进行比对和功能注释,有43 674条Unigene(61.72%)注释成功。在GO数据库中,有28 355条Unigene按功能被划分成3大类56个小类,以执行生物过程的类区所占比例最多。通过KEGG pathway分析,有14 623条Unigene注释成功,发现了显著性富集的32条代谢通路,以代谢相关的基因最多。在KOG数据库中,有15 931条Unigene被分配到26个基因功能大类中,其中以参与一般功能、转录、翻译、修饰及蛋白运输的基因最为丰富。此外,利用MISA软件对转录组序列进行EST-SSR位点搜索与分析,共检测到2 260条Unigene含有2 462个EST-SSR位点,分布频率为3.48%,其中有180条序列含有一个以上EST-SSR位点,83条序列含有复合EST-SSR位点,以三核苷酸重复基元类型最为丰富,占42.53%(1 047个EST-SSR),重复次数主要以5~8次为主。这些重要的转录组序列为进一步了解金钱松生物学过程的分子机制提供了有价值的信息,并为未来的功能基因组分析、分子标记开发和群体遗传学分析提供了丰富的资源。  相似文献   

18.
[目的]分析藤茶高通量转录组序列,从中挖掘出黄酮类化合物合成相关基因,为进一步揭示藤茶黄酮类化合物生物合成调控机制提供理论参考.[方法]分别采集藤茶的幼叶和成熟叶,提取其总RNA构建cDNA文库,采用Il-lumina HiSeqTM 4000高通量测序平台对藤茶叶片进行转录组测序,经过滤处理后运用Trinity组装,将获得的Unigene与Nr、Nt、Pfam、Swiss-Prot、GO、KO和KOG 7个数据库进行比对注释,并预测Unigenes的编码区序列(CDS);基于KEGG信号通路富集分析,发掘藤茶黄酮类化合物合成相关基因.[结果]藤茶叶片转录组测序获得82126236条原始测序序列(Raw reads),过滤处理后得到80156972条高质量序列(Clean reads),进一步组装拼接得到92472条Unige-nes,平均长度为1208 bp,N50长度为1780 bp,其中,至少在1个数据库注释的Unigenes有84217条,占Unigenes总数的91.07%,有8944条Unigenes在7个数据库均被注释,占Unigenes总数的9.67%.在GO数据库成功注释的41116条Unige-nes可分为生物学过程、细胞组分和分子功能三大类,共56个小类;在KOG数据库注释的14553条Unigenes可分成25类,其中,一般功能预测注释成功的Unigenes最多(1946条);其次是翻译后修饰、蛋白质翻转、分子伴侣(1776条),参与次生代谢物质的生物合成、转运和降解的Unigenes较少,仅有319条;KEGG信号通路富集分析发现,共有15262条Unigenes注释到128条KEGG信号通路,以注释为代谢的Unigenes最多,为8694条,其中筛选获得有98个黄酮类化合物合成相关基因,分别编码苯丙烷代谢通路的3种关键酶和类黄酮代谢通路的14种关键酶.藤茶叶片转录组Unigenes与Swiss-Prot和Nr数据库比对,获得52582条CDS序列,ESTScan 3.0.3预测获得35535条CDS序列.[结论]藤茶在细胞过程、代谢过程、单有机体过程、细胞和细胞部分、结合和催化活性能力分布的基因较丰富,在一般功能、翻译、翻译后修饰、蛋白质翻转及分子伴侣的基因表达量较高,具有较强的碳水化合物代谢能力.多种关键酶基因参与藤茶黄酮类化合物的生物合成,推测其生物合成途径存在多条分支,调控机制也较复杂.  相似文献   

19.
利用毛葡萄叶片高通量转录组测序数据进行简单重复序列(simple sequence repeat,简称SSR)搜索并对其所在的序列进行注释,从而为毛葡萄分子标记开发提供有效信息。从35 238条质量较高的unigene中搜索到4 428个SSR位点,对这些序列进行基因本体(gene ontology,简称GO)、同源蛋白质簇(cluster of orthologous groups of proteins,简称COGs)和京都基因与基因组百科全书(Kyoto encyslopedia of genes and genomes,简称KEGG)分类,给出功能注释和Pathway注释,共注释了3 197条unigene。COG数据库将SSR序列分成25类,通过GO分类和KEGG富集性分析,将SSR序列分别归类于38个GO类别和103条通路。这些序列涉及了许多重要的生物功能和代谢途径,预示着这些潜在的标记可能与重要的生物功能有关,这些信息为毛葡萄分子标记的开发和应用奠定了基础。  相似文献   

20.
膜果麻黄种子不同发育时期的转录组测序分析   总被引:1,自引:0,他引:1  
以不同萌发期间的膜果麻黄(E.przewalskii)种子为研究对象,应用新一代高通量测序技术平台Illumina Hi SeqTM2000对其进行转录组测序和数据重新组装,结果获得了12 999 122条初始序列,总长为1 169 920 980bp,初始序列组装获得序列片段的平均长度与N50值分别为351和548 bp;与COG功能注释、GO分类及KEGG代谢通路分析后,获得了49 449个GO功能注释、17 751个COG功能注释以及16 748个KEGG注释;并从KEGG通路中找到有关芪类、二芳基庚烷和姜醇合成途径的编码基因片段230个。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号