首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
为了从不同基因型葡萄组织的表达序列标签(EST)中得到候选单核苷酸多态性(SNP)位点,从NCBI的dbEST数据库中下载来源于9个不同葡萄基因型的不同组织EST序列42493条,利用CAP3软件拼接得到6126个重叠群(contig),将拼接结果导入QualitySNP进行SNP筛选;同时,为提高候选SNP位点的可靠度,降低小规格contig开发SNP的假阳性率和大规格contig开发SNP的假阴性率,设置候选SNP位点的次要等位基因频率至少为30%,SNP侧翼序列保守度至少为5bp.结果表明:仅在1195个contig中存在候选SNP位点,共5032个,其中包括1800个颠换类型,2896个转换类型,336个单碱基的插入与缺失(indel),SNP的平均出现频率为4畅2SNP爛contig-1.利用CAPS(酶切扩增多态序列)分子标记和重测序方法对其中几个候选SNP位点进行验证表明,符合人工筛选原则且来自于小规格contig的候选SNP位点检测结果较好,可靠度最高.  相似文献   

2.
从NCBI中的EST数据库下载已公布的甘蔗EST序列28 512条,利用DNAStar软件中的Seqman程序进行叠连群构建,EST序列共构建3 449个叠连群,从中筛选出93个叠连群,长度共计105 385 bp,发现候选SNP位点1 449个,SNP平均出现频率为1.37%,共有74个contigs含有SNP位点,平均每个contig含有19.58个SNP位点,含有SNP位点数最多的1个叠连群有229个SNP候选位点,不同的叠连群含有的SNP位点数量差异较大,但转换类型与颠换类型所占比例很接近。本研究所用的叠连群的总长度是105 385 bp,平均72.93 bp含有1个SNP位点。  相似文献   

3.
陆地棉基因组精细定位需要更加丰富的分子标记,为了阐明单核苷酸多态性(SNP)标记资源开发利用的前景,对GenBank数据库中陆地棉表达序列标签(EST)和基因组序列(GSS)进行分析。下载GenBank数据库中公布的陆地棉EST序列及GSS序列,利用DNAStar软件进行叠连群构建及其候选SNP位点分析。结果表明:陆地棉EST序列307 414条及GSS序列242 015条,EST序列构建3 737个叠连群,序列累计10 477 241bp。由4条及以上序列组成的叠连群累计序列长度为3 761 800bp,发现候选SNP位点1 007 258个,叠连群平均出现1个SNP位点最低频率为2.32%。GSS序列共构建1 517个叠连群,序列累计1 625 700bp,发现SNP位点574 296个,叠连群平均出现1个SNP位点最低频率为9.18%。陆地棉的EST和GSS均有频率较高SNP位点,GSS出现SNP频率高于EST序列,开发SNP引物3 254对。  相似文献   

4.
陆地棉基因组精细定位需要更加丰富的分子标记,为了阐明单核苷酸多态性(SNP)标记资源开发利用的前景,对GenBank数据库中陆地棉表达序列标签(EST)和基因组序列(GSS)进行分析.下载GenBank数据库中公布的陆地棉EST序列及GSS序列,利用DNAStar软件进行叠连群构建及其候选SNP位点分析.结果表明:陆地棉EST序列307414条及GSS序列242015条,EST序列构建3737个叠连群,序列累计10477241 bp.由4条及以上序列组成的叠连群累计序列长度为3761800 bp,发现候选SNP位点1007258个,叠连群平均出现1个SNP位点最低频率为2.32%.GSS序列共构建1517个叠连群,序列累计1625700 bp,发现SNP位点574296个,叠连群平均出现1个SNP位点最低频率为9.18%.陆地棉的EST和GSS均有频率较高SNP位点,GSS出现SNP频率高于EST序列,开发SNP引物3254对.  相似文献   

5.
[目的]发掘出一批玫瑰SNP候选位点,为进一步开发玫瑰EST-SNP标记及研究玫瑰遗传背景、相关性状的分子标记等打下基础.[方法]从美国国立生物技术信息中心(NCBI)的dbEST数据库下载27125条玫瑰EST序列,经生物信息学方法分析,发掘玫瑰EST-SNP位点,并对其所在核苷酸序列进行功能注释分析.[结果]对27125条EST进行拼接,共得到3544条重叠群(Contigs),其中有243个Contigs含有SNP候选位点.从中筛选出224个候选EST-SNP位点,其碱基突变类型中转换和颠换的数量分别占SNP候选位点总数的59.8%和27.2%.通过序列比对分析,发现有22个SNP位点来源于蔷薇科植物(与玫瑰同科),其中来源于野草莓的基因最多(8个),另有15个SNP位点所在的EST序列与某些软体动物门物种的基因具有较高同源性.[结论]NCBI中的玫瑰EST数据库数据庞大,足够发掘出大量的SNP标记,使得以EST-SNP对蔷薇科玫瑰等植物进行品种鉴定、分类、遗传多样性分析具有可行性.  相似文献   

6.
利用生物信息学手段,从NCBI中db EST数据库获取大量的石斛属(Dendrobium Sw.)EST序列,对SNP与EST的数量及拼接结果之间的关系、SNP碱基置换的偏好性进行了分析。采用DNASTAR软件中的SeqMan程序对获取的16 183条石斛EST序列构建叠连群,得出2 267个叠连群,长度计628 444 bp,发现342个叠连群共含有1 083个候选SNP位点。经统计分析SNP位点平均出现频率为0.17%,平均580.28个bp含有1个SNP位点,每个叠连群含有3.25个SNP位点。不同叠连群SNP位点个数差异较大,其中含SNP位点最多的叠连群共有22个SNP位点。突变中转换和颠换类型差异较大,数量分别为655和408,插入缺失为20个,分别占SNP位点总数的60.5%、37.7%、1.8%。通过对SNP位点所在核酸序列的同源比对分析发现共有1 021个SNP位点所在的核酸序列与同属植物铁皮石斛(D.candidum)的302个基因同源,且同源性基本都在89%以上。  相似文献   

7.
日本沼虾EST-SNP的筛选及多态性检测   总被引:1,自引:0,他引:1  
利用EST数据库开发SNP是筛选SNP标记的重要途径。本研究利用日本沼虾现有EST数据开发SNP标记—从NCBI获得8 458条EST序列;Seqclean软件去除序列中的载体、引物和接头等污染序列,得到8 453条EST序列;利用Quality SNP软件对预处理后序列中含有4条以上同源序列重叠群进行分析,在含有4条以上同源序列的1 055个重叠群中,筛选得到可靠SNP(Reliable SNPs)位点705个,较可信SNPs(High confidence SNPs)905个,潜在SNPs(Potential SNPs)1 144个。根据候选SNP位点设计28对引物,通过聚丙烯酰胺凝胶电泳分析,基因分型验证44个太湖个体,13对引物具有二等位基因多态性,观测杂合度和期望杂合度范围分别为0.259~0.745和0.255~0.728。结果表明,EST数据库中存在大量SNP位点,筛选的SNP标记可用于日本沼虾遗传学分析。  相似文献   

8.
为发掘出一批香蕉的SNP位点、进一步研究香蕉的遗传关系、相关性状的定位等打下基础,从美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)的dbEST数据库下载46 665条香蕉EST序列,经生物信息学方法分析发掘EST-SNP位点,并对其所在核酸序列进行功能注释分析。通过对46 665条EST进行拼接,共得到3 490条重叠群(contigs),在含有4条以上重叠群中发现有39条重叠群中含有SNP位点,从中筛选出127个候选SNP位点,其碱基突变类型中转换、颠换分别占SNP位点总数的63.78%、36.22%。通过序列比对分析发现了34个与香蕉相关基因,证明NCBI中的香蕉EST数据库数据量大,能够发掘出SNP标记对香蕉进行品种鉴定、分类和遗传多样性分析。  相似文献   

9.
【目的】利用桑科的EST数据库进行桑树EST—SSR引物开发,为丰富桑树SSR数据库提供参考。【方法】下载NCBI中桑科的EST数据库,进行序列处理及拼接后,用SSRIT搜索其中的SSR位点,以Primer Premier 5.0设计引物,选用5个桑树品种各5株样品进行多态性引物筛选。【结果】下载的EST拼接后得到2008条拼接片段(contig),共搜索到831个SSR位点,分布在799个contig中。二、三核苷酸重复基元是主导类型,分别占总SSR的66.06%和32.37%;TC/AG和CT/GA是二核苷酸优势重复基元,分别占二核苷酸总数的28.64%和25.87%。设计合成77对EST—SSR引物,其中46对能够扩增出有效条带;经多态性筛选,26对引物可扩增出多态性条带。【结论】利用桑属近缘属的EST序列进行桑树EST—SSR引物的开发是可行的;开发出的26对多态性引物可用于桑树遗传多样性分析和种质鉴定等。  相似文献   

10.
为发掘鮸鱼的EST-cSNP位点,以测序获得的鮸鱼脾脏4609条高质量表达序列标签(expressed sequence tags,EST)序列为源序列,利用Vector NTI 11.0软件拼接出707条重叠群(contig)序列,检测到209个可信度高的编码区单核苷酸多态性(coding-region single nucleotide polymorphism,cSNP)位点;SNP位点数在包含SNP序列中的发生概率为0.743%,在209个SNP位点中包含114个碱基转换位点、74个碱基颠换位点和21个插入缺失位点,转换与颠换比为1.54;对所鉴定的SNP位点的相关序列进行基因注释表明,这些序列包括一批与免疫抗逆相关的基因,例如主要组织相容性复合体、免疫球蛋白、T细胞受体以及各类蛋白酶等.说明所发掘的SNP将有助于促进鮸鱼的分子遗传学及分子辅助育种研究.  相似文献   

11.
【目的】探讨从EST序列电子克隆全长基因序列的有效性,为今后快速克隆和研究免疫相关基因提供新方法。【方法】以正常猪外周血淋巴细胞cDNA文库测序所得的EST序列作为起始材料,应用生物信息库对文库中的部分EST序列进行电子克隆,并用RT-PCR验证其准确性。【结果】电子克隆正常猪外周血淋巴细胞cDNA文库序列,共获得20条片段重叠群(Contigs),经基因注释,证实其均得到了有效延伸,具有完整开放阅读框(ORF),其中已知的猪基因序列14条,猪新基因序列6条;从已知猪基因序列和未知猪新基因序列中各抽取1条感兴趣序列(ESTcontig110和ESTcontig133)进行全长cDNA预测,发现电子克隆所得序列ESTcontig110和ESTcontig133的预期扩增片段(ORF)与实际扩增片段(ORF)基本一致,核苷酸相似性在98.0%以上,氨基酸相似性在93.0%以上。而对ESTcontig133的ORF序列(猪的60S核糖体蛋白L18a亚基)进行基本特性及结构预测,发现ORF133蛋白为非分泌型蛋白,由6个折叠和6个螺旋结构组成,含有8个不同的磷酸化位点。【结论】从EST序列电子克隆全长基因是可行的,为今后快速克隆和研究免疫相关基因提供了参考。  相似文献   

12.
【目的】探讨从EST序列电子克隆全长基因序列的有效性,为今后快速克隆和研究免疫相关基因提供新方法。【方法】以正常猪外周血淋巴细胞cDNA文库测序所得的EST序列作为起始材料,应用生物信息库对文库中的部分EST序列进行电子克隆,并用RT-PCR验证其准确性。【结果】电子克隆正常猪外周血淋巴细胞cDNA文库序列,共获得20条片段重叠群(Contigs),经基因注释,证实其均得到了有效延伸,具有完整开放阅读框(ORF),其中已知的猪基因序列14条,猪新基因序列6条;从已知猪基因序列和未知猪新基因序列中各抽取1条感兴趣序列(EST contig110和EST contig133)进行全长cDNA预测,发现电子克隆所得序列EST contig110和EST contig133的预期扩增片段(ORF)与实际扩增片段(ORF)基本一致,核苷酸相似性在98.0%以上,氨基酸相似性在93.0%以上。而对EST contig133的ORF序列(猪的60S核糖体蛋白L18a亚基)进行基本特性及结构预测,发现ORF133蛋白为非分泌型蛋白,由6个折叠和6个螺旋结构组成,含有8个不同的磷酸化位点。【结论】从EST序列电子克隆全长基因是可行的,为今后快速克隆和研究免疫相关基因提供了参考。  相似文献   

13.
利用SNP标记构建茶树品种资源分子身份证   总被引:3,自引:0,他引:3  
【目的】建立茶树品种的SNP分子标记数据库,结合茶树品种基本信息,将SNP位点组成的DNA指纹图谱构建28位数字组成的茶树品种资源分子身份证,便于茶树品种资源的保护与精准管理,避免“同名异物、同物异名”的现象。【方法】通过挖掘茶树的表达序列标签,获得大量的高质量表达序列标签,将其进行装配后,开发候选位点,将候选位点与茶树全基因组进行BLAST,得到其在全基因组染色体上的位置与具体关联基因。以铁观音、福鼎大白茶、龙井43、云抗10号等103份国内外不同类型的茶树品种资源为供试材料,提取基因组DNA,利用预扩增技术和微流体芯片法对供试茶树品种资源进行SNP基因分型,获得SNP位点数据及候选SNP位点的信息指数、观测杂合度、期望杂合度等信息,将多态性从高到低进行排序,进行SNP位点组合筛选,得到最优SNP位点组合后,结合茶树品种基本信息构建茶树品种资源分子身份证。【结果】从茶树的表达序列标签数据库中挖掘出1 786个候选SNP位点。根据序列保守性,筛选出96个SNP标记位点,与最新茶树基因组比对发现候选位点较均匀地分布于茶树全基因组的15条染色体上;对茶树品种资源的候选SNP位点的多态性信息进行分析,剔除10个不具多态性的位点,剩余86个位点的信息指数平均值为0.517,观测杂合度平均值为0.370,期望杂合度平均值为0.346,固定指数平均值为-0.036,次等位基因频率平均值为0.269。从86个SNP位点中筛选出24个多态性高的SNP位点,组成DNA指纹图谱,可区分出全部参试茶树品种资源。对24个SNP位点组成的DNA指纹图谱并结合茶树品种资源基本信息进行数字编码,最终形成由28位数字组成的茶树品种资源分子身份证。【结论】依据SNP标记的多态性信息,筛选SNP位点,精准区分全部供试茶树品种,并将24个SNP位点所构建的茶树品种资源DNA指纹图谱及品种资源的基本属性信息编码成特定的数字串,使每份茶树品种资源具有唯一的分子身份证,并生成相应的条形码和二维码,可快速被扫码设备识别。  相似文献   

14.
葡萄EST-SSR标记的开发及其应用   总被引:4,自引:0,他引:4  
从NCBI公共数据库中随机下载葡萄表达序列标签(expressed sequence tag,EST)8 925条,利用Phrap软件对这些序列进行拼接后形成5 642条序列,利用MISA软件共发掘出含有SSR位点的序列336条,共含有367个SSR位点,候选SSR位点出现的频率为6.50%。二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复单元的SSR数目分别为79(21.53%)、83(22.62%)、29(7.9%)、60(16.35%)和116(31.61%)。利用Primer 3.0 Plus软件随机设计50对引物进行PCR扩增,用6%非变性聚丙烯酰胺凝胶电泳分析这些SSR引物的PCR扩增产物多态性。50对引物中有36对引物能在20个葡萄品种中扩增出理想的PCR产物,占总引物的72%。其中,26对引物扩增条带具有多态性。利用16对经过验证的EST-SSR引物对20个葡萄品种亲缘关系的分析获得了理想的研究结果。  相似文献   

15.
采用高分辨率熔解曲线分析技术(HRM)对虾夷马粪海胆溶菌酶基因进行突变扫描,筛选出26个SNP候选位点。其中,碱基置换类型位点16个,占位点总数的61.54%;碱基插入或缺失的位点6个,缺失的碱基数为1~4个不等,占位点总数的23.08%;碱基置换类型模糊以及三态位点4个,占位点总数的1538%。SNP在虾夷马粪海胆溶菌酶基因的cDNA中的分布频率约为2.85%,位于编码区的位点有18个,其中2个为错义突变。应用小扩增子基因分型法对5个SNP位点在2个不同地域群体的60个样本中进行分型分析,结果显示:5个SNP位点均含有2个等位基因,次等位基因频率分布范围为0.150 0~0.500 0,位点SILyz-7、SILyz-15和SILyz-20在两个群体间的次等位基因频率相差较大。研究结果表明,HRM是一种高效便捷的SNP分析方法,所筛选出的SNP标记可用于虾夷马粪海胆遗传育种的研究。  相似文献   

16.
The Mining of Citrus EST-SNP and Its Application in Cultivar Discrimination   总被引:2,自引:0,他引:2  
Single nucleotide polymorphisms (SNPs) are the most abundant sequence variations found in plant genomes and are widely used as molecular genetic markers in cultivar identification and genetic diversity studies. The objective of this study was to identify SNP markers useful for discrimination of citrus cultivars, since large numbers of expressed sequence tags (ESTs) of sweet orange are available from the National Center for Biotechnology Information (NCBI). We now have the opportunity to discover SNP markers suitable for determining the haplotypes with which to distinguish very closely related cultivars and to assess genetic diversity within or between related species of citrus. SNPs and small insertions/deletions (Indels) from ESTs of sweet orange and satsuma were identified by the in silico SNP discovery strategy. 55 296 EST sequences of sweet orange and 2 575 of satsuma retrieved from the NCBI repository were mined for potential SNPs. Cleaved amplified polymorphic sequences (CAPS) and sequencing approaches were used to validate putative SNPs in a sample of 30 citrus accessions. A total of 3 348 putative SNPs were identified based on the abundance of sequences and haplotype cosegregation. Of these 3 348 SNPs, the transitions, transversions and Indels ratios were 47.9, 36.1 and 16.0%, respectively. The SNPs occurred on average at a frequency of 1 per 164 bp in the coding region of citrus. 14 SNPs were randomly selected and genotyped according to 30 citrus accessions including 23 accessions of sweet orange; 11 SNPs displayed polymorphism with an average polymorphism information content (PIC) of 0.20 among 30 citrus accessions. The genetic diversity present in sweet orange was low, so the 14 SNP markers failed to discriminate different cultivars of sweet orange, but they did succeed in distinguishing accessions of inter-species of citrus. In this study, SNPs were mined from EST sequences of sweet orange and satsuma, which displayed potential capability as molecular markers to discriminate inter-species accessions of citrus. It is anticipated that these putative SNPs could be applied in citrus genetics research and breeding.  相似文献   

17.
【目的】前期根据转录组数据挖掘柑橘单核苷酸多态性(single nucleotide polymorphism,SNP)位点,通过关联分析获得14个与柑橘溃疡病耐/感性关联的SNP。以此为基础,本研究利用柑橘杂交群体验证这些位点与柑橘溃疡耐/感性的相关性,以期获得显著相关的SNP,并对其相关的基因进行柑橘溃疡病菌(Xanthomonas citri subsp. citri,Xcc)和植物激素诱导表达分析。【方法】以抗病和敏感柑橘品种及其杂交F1代群体共143个材料为试材,采用离体叶片针刺接种法进行溃疡病抗性鉴定;利用高分辨率熔解曲线(high resolution melting,HRM)技术,对F1群体进行SNP分型;使用DPS软件对F1群体的溃疡病耐/感性表型和SNP基因型进行相关分析;实时荧光定量PCR(quantitative real-time PCR,qRT-PCR)分析其中一个SNP相关的柑橘钙依赖性蛋白激酶基因(calcium-dependent protein kinase gene,CDPK)的诱导表达模式。【结果】供试杂交F1代群体的病斑面积在0.75—3.29...  相似文献   

18.
19.
山羊EST资源的SSR分析   总被引:1,自引:0,他引:1  
为充分利用现有数据库中的EST资源开发山羊的分子标记,以期为研究山羊的遗传多样性和利用分子标记辅助选育山羊品种奠定基础,对NCBI dbEST数据库中13497个EST进行聚类分析,获得1999个Contig和5182个singlets,利用软件MISA对此7181个uni—EST进行SSR分析,共发现483个EST—SSR,出现频率为6.73%,平均每10kb就出现一个SSR,这些SSR的长度介于12~174bp之间,平均长度为20.46bp,其中二核苷酸和三核苷酸SSR是主要的重复类型,占所有EST—SSR的81.99%。山羊EST—SSR一共有59种重复基元,其中出现最多的是AC/GT,占所有EST—SSR的21.5%。表明山羊EST—SSR出现频率高、种类丰富,而且58%的含有SSR的EST编码已知功能的蛋白,具有较高的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号