首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
为进一步开发大竹蛏Solen grandis的基因资源,采用2代Illumina Hi-seq测序技术对大竹蛏的鳃组织进行了转录组测序,构建了转录组数据库,获得338 483 476条Clean Reads数据;拼接组装后获得190 856条Unigene数据,平均长度为1147 bp;与NR、NT、KO、Swiss Prot、PFAM、GO、KOG等数据库进行Blast信息比对(E-value为10-5),共获得63 337个注释基因;与NR数据库比对发现,大竹蛏转录组基因序列与长牡蛎Crassostrea gigas具有较高的同源性,为53.3%;将大竹蛏转录组的Unigene的功能通过与KOG数据库进行注释比对划分为25类;GO数据库注释可分为三类,即细胞组分、生物过程和分子功能,共包括65个分支;KEGG分析发现,大竹蛏转录组数据中按照代谢通路可分为92类,利用Blast蛋白库比对和Estscan软件进行ORF预测,获得长度大于300 nt的ORF共50 681个;通过SSR分析,共获得73 089个SSR标记。本研究中获得的转录组信息可为今后进行大竹蛏分子标记的开发和关键基因的克隆及功能分析等研究提供基础数据。  相似文献   

2.
以10年以上树龄的杜仲雌株当年新发枝条上的幼果、嫩芽、叶片和树皮和雄株新发枝条上嫩芽、叶片和树皮为材料,采用Illumina Hi SeqTM2000高通量测序技术进行转录组测序,获得雌株51,574,000条、雄株52,430,502条Clean Reads数据,分别包含总长度为4,641,660,000nt和4,718,745,180nt核苷酸序列数据信息;经拼接组装,获得雌株基因信息长达69,461,730nt的423,339个Contig片段,获得雄株基因信息长达94,814,201nt的542,383个Contig片段;经进一步拼接,分别获得平均长度为288nt的雌株159,434个Unigene片段和平均长度为231nt的雄株257,288个Unigene片段,共有48,761个表达序列标签(EST)。以BLAST(E-value1.0E-5)将Unigene对NR、NT、KEGG和COG数据库进行比对,获得CDS序列35,541条,再通过ESTscan分析获得CDS片段13,220条,共获得48,761条CDS片段。与NR数据库比对发现杜仲雌、雄株转录组Unigene与葡萄相似序列最多(33.8%),其次是蓖麻(11.4%)和杨树(11.2%),与拟南芥的相似序列仅2.3%;根据Unigene与COG数据库比对结果,可将有COG功能的7,571条Unigene分为24类,而根据GO数据库注释,杜仲转录组有GO功能注释的23,314条Unigene可分为生物过程、细胞组分和分子功能3大类55分支。与KEGG数据库比对,杜仲雌、雄株转录组17,468条Ungenes分属128类代谢通路,其中有2,399条属于次生物质代谢途径,314条参与萜类化合物生物合成途径。  相似文献   

3.
旱柳转录组测序及生物学分析   总被引:1,自引:0,他引:1  
对盐敏感旱柳沿江柳和耐盐旱柳9901的杂交F_1代根部进行了RNA-Seq测序和分析,共获取了107 950条Unigene,平均长度为1 076.96 bp。通过与COG、GO等8个数据库比对,60 848个基因获得注释信息,其中38 182条Unigene在GO数据库中获得注释,24 101条Unigene在KEGG数据库中获得注释。GO和KEGG富集分析结果表明,差异表达基因主要调节核糖体代谢、植物激素信号转导等生物学功能。  相似文献   

4.
为了探究"温138"核桃硬壳出现露仁现象的根本原因,从分子水平出发,运用转录组测序技术,探索出硬壳中基因的功能。经测序后,共得到51 521 252个reads片段,包含4 636 912 680个核苷酸序列信息,对reads进行拼接组装后,共得到56 639条Unigene,序列信息长度达到了46 623 389 nt;将Unigene和COG、GO数据库进行比对表明,核桃硬壳转录组中的Unigene根据COG功能可分为25类;根据GO功能可分为生物过程、细胞组分和分子功能3大类53小类。  相似文献   

5.
【目的】获得冬瓜转录组序列、遗传变异等信息,从中挖掘冬瓜基因数据及SSR分子标记,为冬瓜后续研究提供数据支撑。【方法】以冬瓜嫩叶为材料,利用Illumina HiSeq~(TM)2000技术对冬瓜进行转录组测序,构建数据库从中获得干净序列。经De novo拼接组装后,将获得的单基因簇(Unigene)数据在非冗余蛋白数据库(nonredundant protein database,Nr)、蛋白质序列数据库(Swiss Prot protein database,Swiss Prot)、基因本体论数据库(gene ontology,GO)、蛋白质真核同源数据库(eukaryotic orthologous groups,KOG)、东京基因与基金组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)、蛋白质家族域数据库(protein families database,Pfam)6个公共数据库中进行比对,最终得到冬瓜单基因簇注释信息。利用MISA软件对转录组单基因簇进行搜索,获得单基因簇中的SSR位点。【结果】从冬瓜嫩叶中得到62 021 032条高品质序列,组装后获得40 611条单基因簇,平均长度955 bp。将所有单基因簇在Nr和Swiss Prot数据库中进行比对,结果分别比对到27 474及19 573条单基因簇;在GO数据库中,所注释到的10 659条单基因簇分别匹配到生物功能、分子功能和细胞组分3个本体的47个功能组中;与KOG数据库进行注释比对,根据其功能将注释到的单基因簇划分为25类;KEGG数据库比对注释到10 799条冬瓜的单基因簇,可分为5个大类、19个亚类、125条代谢途径;在Pfam数据库中比对到17 990条单基因簇,分属于369个类群。SSR位点搜索发现,有5 086条单基因簇包含SSR序列,获得5 474个SSR位点。【结论】利用高通量测序获得大量冬瓜转录组信息,有助于从分子水平对冬瓜进行深入研究。  相似文献   

6.
泸定百合是非常优良的种质基因资源,鳞茎研究是其科研和生产的关键环节,然而泸定百合鳞茎的分子生物学研究尚属空白。为揭示泸定百合鳞茎的分子机制,应用高通量测序技术对泸定百合的鳞茎进行转录组分析。原始数据经过生物信息学分析后,共获得4.9 G有效数据,43 412条Unigene;所获得的Unigene与NR,GO,COG和KEGG等数据库进行搜索比对后,发现有30 225条和21 531条Unigene分别获得NR和GO注释,14 069条Unigene得到COG注释,GO注释中获得374条Unigene可能作为转录因子参与泸定百合鳞茎的形成与发育;共有10 822条Unigene参与了KEGG代谢途径,其中有571条Unigene注释到次生代谢合成途径,其中66条和23条Unigene分别参与了萜类和生物碱的合成。研究结果为采用生物技术手段提高百合的药用成分的含量及改善其园艺性状积累了基本资料。  相似文献   

7.
[目的]利用高通量测序技术解析红脚艾(Artemisia rubripes Nakai)的转录组信息特征.[方法]通过高通量测序平台Illumina HiSeq 2500对红脚艾进行转录组测序,通过Trinity软件de novo组装获得Unigene,并基于序列同源性对Unigene进行功能注释,得到红脚艾的转录组信息.[结果]测序数据经过质控后共获得24126043条高质量的reads,通过de novo组装获得173093个转录本,对组装的转录本去冗余后共获得85991个Unigene,平均长度为616.87 bp,N50为925 bp.共有47216个Unigene在NR、KEGG、COG、KOG、GO数据库获得功能注释,40802个Unigene在NR数据库注释,显示红脚艾与向日葵(Helianthus annuus)的单基因匹配率最高,16846个Unigene被KEGG数据库注释到130条代谢途径中,26171个Unigene被注释到25个KOG功能分类中,23203个Unigene被GO注释到生物过程、细胞组成和分子功能三大类51个功能分类,12810个Unigene被注释到25个COG功能分类中.[结论]利用高通量测序技术获得了红脚艾转录组信息特征,这些数据将为后期开展功能基因鉴定、解析化合物次生代谢途径及其调控机制奠定研究基础.  相似文献   

8.
香榧具有重要的经济价值,但其基因组信息相对匮乏,限制了其分子生物学和基因功能的研究。本文以不同组织的香榧作为研究对象,采用新一代高通量测序技术平台Illumina Hi Seq?2000对香榧转录组进行测序和数据分析,共得到37,349,086个reads片段,总碱基数为4.35 G。利用组装软件,对获得的高质量序列进行组装,共得到104,636个Unigene,平均长度为784 nt,N50为1,702。将Unigene序列与公共数据库进行比对,28,766个Unigenes获得了注释。其中26,856个Unigene在NR蛋白数据库中获得注释,24,003个Unigenes在NT数据库中获得注释,21,401个Unigene在Swiss-Prot蛋白数据库中获得注释,16,137个Unigene在COG数据库中获得注释,11,410个Unigene在GO数据库中获得注释。根据KEGG注释信息,18,564个Unigene被划分到256个代谢途径中。SSR位点搜索发现,在4,217个Unigene中含有4,706个SSR位点。分析所获得的转录组数据,将为香榧功能基因的克隆,基因的表达,指纹图谱构建和分子标记辅助选育奠定基础。  相似文献   

9.
采用2代 Illumina Hi-Seq 测序技术对2年生杜鹃花白凤4号(Rhododendron pulchurum cv. BaiFeng 4)扦插苗叶片的转录组进行测序,获得了213 723 424条 Clean reads数据,经过质控和De novo。组装共获得平均长度为930 nt的53 568个Unigenes。与Nr、Swiss-Prot、KOG、KEGG四大数据库进行BLAST信息比对(E-value≤10-5),共获得28 877个注释基因。与Nr数据库序列同源性比较发现,杜鹃花与葡萄(Vitis vinifera)具有较高的同源性,而与其他物种的同源性较低。杜鹃花转录组的Unigenes在KOG数据库比对上30 508个注释,分为25类。在GO数据库比对上17 218个Unigenes,其中与抗逆有关的Unigenes有11 928个。在KEGG数据库的132条代谢通路中富集了6 475个杜鹃花Unigenes,其中注释到植物激素生物合成代谢途径和信号转导途径的有384个。同时,有1 062个Unigenes被注释为转录因子,有8 738条SSR标记被挖掘。  相似文献   

10.
对杜仲(Eucommia ulmoides)国审良种‘华仲6号’和‘华仲10号’花后70和160d的种仁共4个样本进行转录组测序,对测序数据进行组装和功能注释分类,并对转录组获得的单基因簇(unigene)进行微卫星特征分析。利用新一代高通量测序技术Illumina HiSeq~(TM)2000对杜仲样品进行转录组测序,采用软件Trinity进行组装;利用BLAST软件将unigene序列分别与Nr、GO、COG和KEGG等数据库比对分析;利用MISA软件对转录组的96 469条unigenes进行SSR搜索。结果表明:转录组测序分析,共得到72 791 399个高质量的序列读取片段(Clean reads),包含了14 702 548 161个的碱基序列(bp)信息。对reads进行序列组装,共获得96 469个平均长度为690bp的unigene,序列信息量达到了66.56 Mb。同源性分析结果显示,有49 856个与其它物种同源的unigenes得到注释,占All-unigene的51.68%。将杜仲转录组中的unigene与GO数据库进行比对分析,根据其功能可将注释到的38 983条unigene分成3大类(细胞组分、分子功能和生物学过程)56个分支;根据COG功能可将注释的14 796条unigene基因划分成25个类别;KEGG数据库作为参照,可将注释到的11 260条unigene定位到117个代谢途径分支;SSR位点搜索结果显示,96 469条unigenes中共包含9 621个完整型SSR位点,占总SSR位点的84.14%。完整型SSR位点共包含55种重复基元,其中出现频率最高的重复基序类型为单核苷酸重复中的A/T(4 597个),其次是AG/CT(2 597个)、AT/AT(439个)。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号