首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
为了从不同基因型葡萄组织的表达序列标签(EST)中得到候选单核苷酸多态性(SNP)位点,从NCBI的dbEST数据库中下载来源于9个不同葡萄基因型的不同组织EST序列42 493条,利用CAP3软件拼接得到6 126个重叠群(contig),将拼接结果导入QualitySNP进行SNP筛选;同时,为提高候选SNP位点的可靠度,降低小规格contig开发SNP的假阳性率和大规格contig开发SNP的假阴性率,设置候选SNP位点的次要等位基因频率至少为30%,SNP侧翼序列保守度至少为5bp。结果表明:仅在1 195个contig中存在候选SNP位点,共5 032个,其中包括1 800个颠换类型,2 896个转换类型,336个单碱基的插入与缺失(indel),SNP的平均出现频率为4.2SNP.contig-1。利用CAPS(酶切扩增多态序列)分子标记和重测序方法对其中几个候选SNP位点进行验证表明,符合人工筛选原则且来自于小规格contig的候选SNP位点检测结果较好,可靠度最高。  相似文献   

2.
基于EST序列的杨树候选SNPs标记分析   总被引:1,自引:0,他引:1  
利用生物信息学方法对来自2个不同cDNA文库的2万余条杨树EST序列进行了候选SNPs标记.研究结果表明,在获得的94个碱基替代型候选SNPs中,A/G替换类型最多,占32.98%,C/T替换型占13.83%,其它碱基置换型SNPs占53.20%.同时,对其中20个候选SNPs位点的重新测序结果表明,有13个(占65%)候选sNPs位点得到证实,其中,11个位点为碱基替代型SNPs,另外2个为杂合型位点.  相似文献   

3.
为发掘鮸鱼的EST-cSNP位点,以测序获得的鮸鱼脾脏4609条高质量表达序列标签(expressed sequence tags,EST)序列为源序列,利用Vector NTI 11.0软件拼接出707条重叠群(contig)序列,检测到209个可信度高的编码区单核苷酸多态性(coding-region single nucleotide polymorphism,cSNP)位点;SNP位点数在包含SNP序列中的发生概率为0.743%,在209个SNP位点中包含114个碱基转换位点、74个碱基颠换位点和21个插入缺失位点,转换与颠换比为1.54;对所鉴定的SNP位点的相关序列进行基因注释表明,这些序列包括一批与免疫抗逆相关的基因,例如主要组织相容性复合体、免疫球蛋白、T细胞受体以及各类蛋白酶等.说明所发掘的SNP将有助于促进鮸鱼的分子遗传学及分子辅助育种研究.  相似文献   

4.
[研究目的]通过筛查猕猴桃EST数据库中的SSR重复序列,可为开发出新型的猕猴桃EST-SSR标记和分子生物学研究奠定理论基础;[方法]从NCBI公共数据库中最新公布的猕猴桃表达序列标签(Expressed Sequence Tag,EST)中随机抽取56400条序列,应用SSRHtmter软件查找微卫星(Microsatellite,SSR)重复序列;[结果]研究结果表明,从猕猴桃EST序列中获得了7939条SSR,其中包括二核苷酸重复5131条(64.63%),三核苷酸重复1237条(15.58%),四核苷酸重复284条(3.58%),五核苷酸重复397条(5.00%),六核苷酸重复890条(11.2l%).在二核苷酸重复序列中,AG/CT共分布4654条(90.70%).大约每2.48 kb长度的单一基因序列中即存在1个SSR,即平均7个单一基因中存在1个SSR;[结论]在猕猴桃EST序列中,二核苷酸重复序列是最丰富的重复单元,其次为三核苷酸重复和六核苷酸重复.在所获得的SSR重复单元中,AG/CT为优势重复.  相似文献   

5.
通过生物信息学手段,下载GenBank数据库中已公布的梅、杏、桃3个物种EST序列各4 660、15 388、82 583条,利用CAP 3软件拼接后序列分别为4 456、5 595和24 243条。经比对发现,同源序列592条,同源序列的总长度为235 576 bp,平均长度和同源性分别为437.67 bp和97.50%;进行Blast比对后发现,所有同源序列中有340个具有相应的功能注释,183个为未知功能蛋白,其余69个为没有相应序列信息的新基因;在所有同源序列中共发现8 818个SNP,总频率为每SNP26.71 bp,并以转换和颠换为主。同时,对3个物种的同源序列进行两两比较发现,SNP数量明显少于这三者比较的结果。利用所有SNP对梅、杏、桃3个特种进行聚类分析,结果表明,梅、杏的亲缘关系较近,而两者与桃亲缘关系较远。  相似文献   

6.
 【目的】充分利用GenBank上的大量葡萄EST序列,建立本地化基因电子表达分析平台,实现基因表达模式的大规模快速分析。【方法】利用生物信息学方法对GenBank上的362 193条葡萄EST序列进行本地化及后续处理,建立电子分析平台,并通过RT-PCR技术对其电子分析准确性进行验证。【结果】建立了包含叶、花等11个组织类别和GA3等5个胁迫类型的基因电子表达分析平台。通过VvAG、VvCHS、VvF3H、VvLDOX等4个葡萄基因的RT-PCR和电子表达分析结果比较发现,平台预测效率较高,在预测EST来源数较多的果实、花序、花组织的表达效果较好,而对叶等EST来源较少的组织的预测效果需结合试验判断。随着dbEST库中源于葡萄各组织EST序列数量的大量增加,平台的预测效果将更加符合基因表达的实际情况。【结论】葡萄基因电子表达分析平台预测效率较高,为葡萄基因大规模快速表达分析以及重要相关信息的挖掘提供了很好的分析工具。  相似文献   

7.
猕猴桃EST序列的SSR信息分析(摘要)   总被引:1,自引:1,他引:0  
[目的]通过筛查猕猴桃EST数据库中的SSR重复序列,为开发出新型的猕猴桃EST-SSR标记和分子生物学研究奠定理论基础。[方法]从NCBI公共数据库中最新公布的猕猴桃表达序列标签(Expressed Sequence Tag,EST)中随机抽取56 400条序列,应用SSRHunter软件查找微卫星(Microsatellite,SSR)重复序列。搜索的标准是:二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸最少重复次数分别为7次、5次、4次、4次、3次,包括复合型微卫星。微卫星的重复次数越多,相应的检验出等位基因数目就越多。[结果]从猕猴桃EST序列中获得了7 939条SSR,其中包括二核苷酸重复5 131条(64.63%),三核苷酸重复1 237条(15.58%),四核苷酸重复284条(3.58%),五核苷酸重复397条(5.00%),六核苷酸重复890条(11.21%)。大约每2.48 kb长度的单一基因序列中即存在1个SSR,即平均7个单一基因中存在1个SSR。在二核苷酸重复序列中,AG/CT共分布4 654条(90.70%)。在三核苷酸中,较为丰富的3种重复基元是ACC/GGT,AAG/CTT和CGC/GCG,共分布817条,它们占三核苷酸重复中各重复基元的66.04%。在其他基元中,还包括AGG/CCT,AGC/GCT,AAC/GTT,ATC/GAT,AGT/ACT,CGA/TCG,AAT/ATT7种重复基元,共420条SSR序列,占33.96%。AGT与CGT重复基元未见分布。[结论]在称猴桃EST序列中,二核苷酸重复序列是最丰富的重复单元,其次为三核苷酸重复和六核苷酸重复。在所获得的SSR重复单元中,AG/CT为优势重复。  相似文献   

8.
牡丹EST资源的SSR信息分析   总被引:1,自引:0,他引:1  
首先对NCBI数据库下载获得的2204条牡丹EST序列进行比对,去冗余后得到1658条牡丹EST序列,然后利用MISA软件对这些序列进行筛查,结果在其中901条EST序列中发掘出1111个SSR,出现频率为67.00%,平均每1 004bp出现1个SSR.在牡丹EST-SSR中,单核苷酸重复是最主要的重复类型(89.38%),其次是二核苷酸重复(6.67%)和三核苷酸重复(3.78%),四核苷酸重复和六核苷酸重复分布极少,没有五核苷酸重复.A/T是优势重复基元,占微卫星总数的87.76%.牡丹EST-SSR基元类型的重复次数主要集中在6~30次,其基元长度主要集中在26~31bp.  相似文献   

9.
利用RNA-Seq技术对三角鲂的肝脏进行了转录组测序,获得了大量EST序列后,利用MISA软件进行微卫星信息分析。结果表明,通过转录组测序获得三角鲂EST序列62780条,长度31.9 Mb,发现8853个SSR,出现频率为14.1%。在三角鲂EST-SSR中,重复单元以12碱基重复为最多,并以长度小于16 bp的短重复序列为主,间隔SSR和复合SSR的EST序列RPKM均值低于单纯型SSR的EST序列RPKM均值,且在单纯型SSR中SSR长度越长,其RPKM均值则越低。因此,对富含SSR位点的EST序列的挖掘将为开发SSR特异性标记,并应用于三角鲂生物多样性和选育提供了参考。  相似文献   

10.
利用RNA-Seq技术对三角鲂的肝脏进行了转录组测序,获得了大量EST序列后,利用MISA软件进行微卫星信息分析。结果表明,通过转录组测序获得三角鲂EST序列62780条,长度31.9 Mb,发现8853个SSR,出现频率为14.1%。在三角鲂EST-SSR中,重复单元以1~2碱基重复为最多,并以长度小于16 bp的短重复序列为主,间隔SSR和复合SSR的EST序列RPKM均值低于单纯型SSR的EST序列RPKM均值,且在单纯型SSR中SSR长度越长,其RPKM均值则越低。因此,对富含SSR位点的EST序列的挖掘将为开发SSR特异性标记,并应用于三角鲂生物多样性和选育提供了参考。  相似文献   

11.
从NCBI公共数据库下载获得27 904条鹰嘴豆表达序列标签EST,去除其中低质量的和冗余序列后得到全长为6 198 092 bp的11 224 条无冗余EST.利用SSRIT(Simple sequence repeat identification tool)软件共在这些序列中发掘出982个SSR,它们分布于865条EST中,出现频率为8.69%,平均长度为15.58 bp,平均距离为6.31 kb.在鹰嘴豆EST-SSR中,二核苷酸重复是最主要的重复类型(66.90%),其次是三核苷酸重复类型(30.75%),出现最多的重复基元类型是TA/AT(24.95%).  相似文献   

12.
水稻淀粉分支酶(OsSBEIIb)对水稻支链淀粉的合成至关重要,而水稻支链淀粉的含量与水稻支链淀粉和抗性淀粉的含量密切相关.为了明确OsSBEIIb基因在水稻淀粉合成中的作用,通过PCR技术扩增获得了湘早籼2号水稻的OsSBEIIb基因cDNA编码区序列.生物信息学分析表明,OsSBEIIb基因具有一个编码825个氨基...  相似文献   

13.
张俊娥 《安徽农业科学》2012,40(26):12789+12799
[目的]分析水稻EST中微卫星序列。[方法]利用MISA(MIcroSAtellite)软件分析了微卫星在水稻EST中的分布频率与密度。[结果]在1 690 257条EST序列中,有907 071条序列含有微卫星,微卫星之间的距离约为0.51 kb。其中,六碱基重复丰度最大,占47.1%,而三碱基、单碱基、四碱基、二碱基和五碱基重复丰度分别为22.4%、18.5%、6.8%、3.1%和2.1%。表明三碱基重复丰度占到较高比例(22.4%),因此可从现有的ESTs数据中方便地获取有效的水稻微卫星标记。[结论]该研究结果可以为水稻种质资源鉴定和品种改良提供有用的基因信息资源。  相似文献   

14.
 EST (Expressed Sequence Tag,EST)指的是一组cDNA的部分序列,一般长度为150~500bp,是由大规模随机挑取的cDNA克隆测序得到的组织或细胞基因组的表达序列标签。一个EST代表生物某一时期的某种组织或细胞的一个表达基因。主要综述了EST技术的原理方法以及EST技术在构建遗传学图谱、分离与鉴定新基因、基因表达谱的研究、比较基因组学的研究和制备DNA芯片等方面的应用。  相似文献   

15.
表达序列标签(EST)分析及藻类EST文库的研究进展   总被引:2,自引:0,他引:2  
随着生物信息学的发展,表达序列标签(EST)在基因组作图、克隆基因、新基因的识别、蛋白质组研究等方面具有重要作用。笔者简要介绍了EST技术的原理及其在构建遗传图谱、分离与鉴定新基因等方面的应用。综述了藻类EST文库的研究现状,并对EST的应用前景进行了展望。  相似文献   

16.
 为开发出具有丰富多态性的、新型的小麦EST SSR标记,利用已公布1071367条小麦表达序列标签(expressed sequence tags,EST)序列,对≥24bp的微卫星或简单重复序列进行了系统分析。结果表明,在所分析的小麦EST序列中,搜索到长度大于或等于24bp,基序匹配值大于80%的SSR序列32350个。在这些SSR中,单碱基SSR最多,数量达18075个,占SSR总数的559%;其次为3核苷酸SSR,共6106个,占SSR总数的187%,重复数大于30次以上的达444个,占所有3核苷酸SSR的72%。4核苷酸SSR数量最少,仅有696个,仅占SSR总数的22%。研究中收搜索到的6核苷酸SSR共1562个,其基序组成可分为145类,优势基序为AGCCGC(达214个)。以上结果说明小麦EST序列中含有丰富的SSR,这非常有利于开发多态性较高的EST SSR标记。  相似文献   

17.
[目的]温带臭虫(Cimex lectularius)是世界性分布的吸血性寄生虫,主要靠吸食人血为生。探究温带臭虫转录组SSR和SNP分布规律,可为后期温带臭虫的SSR和SNP分子标记开发、遗传多样性分析以及遗传图谱构建等研究奠定基础。[方法]以转录组数据为基础,利用软件msatcommander v0.8.2和SOAPsnp v1.03系统分析了SSR和SNP位点多态性和分布特征。[结果]温带臭虫转录组数据的25 468条unigene中含有4 758个SSR位点,分布在4 171unigene序列中。其中单核苷酸重复的次数最多,共有2 795个,占总数的58.74%,其次是三核苷酸重复和二核苷酸重复分别是984个(20.68%)和764个(16.06%),四核苷酸重复有195个(4.10%),而五、六核苷酸重复最少,仅出现20次(0.42%)。在温带臭虫的SSR位点中,共出现30个重复基元,其中优势的重复基元类型是A/T,共有2 757个,其次是AT/AT,有474个,ATT/AAT有342个。在25 468个unigene中共发现76 562个simple SNPs,其中转换类型46 634个,占60.91%,颠换类型29 928个,占39.09%。碱基转换类型比例高于颠换类型。6种单碱基变异类型中,C-T发生频率最高,比例为30.69%,其次为A-G,比例为30.22%。[结论]温带臭虫转录组中SSR和SNP位点数量多,出现频率高,且类型丰富。  相似文献   

18.
表达序列标签 (expressed sequence tag,EST)是在生物体特定时空表达基因的一段 c DNA序列。随着生物信息学的发展 ,EST已成为基因定位、基因克隆、基因表达分析的有力工具。文章对应用 EST克隆基因和分析基因表达的研究进展进行了综述 ,并讨论了利用 EST进行基因克隆和表达分析时应注意的问题和发展趋势  相似文献   

19.
基于SNP遗传图谱定位甘蓝型油菜千粒重QTL位点   总被引:1,自引:0,他引:1  
【目的】甘蓝型油菜籽粒重量是构成油菜单株产量的三大因素之一(单株有效角果数、每角果粒数、粒重),是重要的育种目标。通过对5种环境下甘蓝型油菜千粒重进行QTL定位分析,寻找甘蓝型油菜千粒重的QTL及影响本甘蓝型油菜群体千粒重的候选基因。【方法】利用重组自交系群体在德国吉森、重庆北碚5种不同的环境下,测定各株系天然种子千粒重。利用重庆市油菜工程技术研究中心实验室构建的SNP高密度遗传图谱扫描5种环境中的千粒重QTL。该遗传图谱包括2 795个SNP位点,覆盖甘蓝型油菜基因组1 832.9 cM,标记之间的平均距离为0.66 cM。利用Windows QTL Cartographer2.5复合区间作图法对千粒重进行QTL定位。将49个拟南芥粒重相关基因与QTL对应置信区间序列进行同源比较分析(E值<1E–21),找出可能与甘蓝型油菜千粒重关联的候选基因。【结果】5种环境中千粒重变异范围较大,且均呈现正态分布,符合QTL定位要求。在5种环境之间千粒重均表现出正相关,其中,2013北碚与2012北碚、2008年吉森达到极显著水平,相关系数分别为0.248和0.249;2012年北碚与2010年北碚、2011年北碚及2008年吉森达到显著相关,相关系数分别为0.226、0.397和0.190。5种环境中共检测到14个QTL,分布在9条染色体,其中,C03染色体3个,A06、A07和C01各有2个,A03、A05、A08、A10和C02染色体上各有1个,LOD值在2.57-6.05,单个QTL解释的表型变异为4.64%-14.13%。与拟南芥粒重基因进行同源性分析,有16个粒重相关基因落在8个QTL置信区间,匹配E值介于0-2E-21。其中QTL qTSWA07-2区间内筛出7个粒重基因。粒重基因TTG2qTSWA03-1qTSWC02-1 2个QTL区间内均被检测到。AHK3qTSWA07-2qTSWA08-1qTSWC01-1区间内被检测到。【结论】利用该套油菜60K芯片准确定位了5种环境条件千粒重的QTL位点,与拟南芥粒重基因比对出该群体油菜粒重基因,该结果有利于不同材料在使用该套SNP芯片分析及对千粒重QTL位点的比对和候选基因的分析。  相似文献   

20.
将黄瓜授粉前后多个发育阶段的幼果组织等量混合后提取总RNA和mRNA,以λTriplEx2为栽体、XL1-Blue为宿主茵,构建了1个黄瓜幼果cDNA文库;其滴度为1.165×106pfu/mL,重组率在94.4%左右.测序获得116条EST,92.2%的长度在400 bp以上,19%为重叠序列.在GenBank中进行BLAST分析后确认与已知功能基因相似的EST序列有71条,有相似序列而功能未知的基因和没有相似序列的EST序列各占19.83%和18.97%.从对文库的检验结果看,构建的cDNA文库重组率较高,库容达到预期要求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号