首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
本文利用生物信息学方法搜索毛果杨全基因组中完整型SSRs序列,并对其进行生物信息学分析。结果表明,毛果杨全基因组共统计了143 810个SSRs序列,占其全基因组长度的比率为0.63%,其全基因组SSRs序列出现频率为331.26个/Mb。毛果杨基因组中SSRs数量最多的是第1条染色体,其次是第2、5、6条染色体,数量较少的是第9条染色体。毛果杨各条染色体上SSRs序列出现频率在310~360个/Mb,无明显差异。通过检验表明,毛果杨染色体长度与其所含SSRs频率和密度无相关性(Kendall's tau-b,P0.05;Spearman's rho,P0.05),而其染色体长度与其所含SSRs数量具有高度正相关性(r0.85,P0.01)。毛果杨全基因组中单核苷酸SSRs序列数量最多(42.79%),其次依次是二核苷酸三核苷酸四核苷酸五核苷酸六核苷酸重复类型。毛果杨全基因组SSRs各重复类型拷贝数分布范围为4~111次,主要集中在4~30次。  相似文献   

2.
茶树转录组中SSR位点的信息分析   总被引:2,自引:2,他引:2  
利用茶树全转录组的高通量测序获得的127 094条Unigenes来发掘茶树转录组SSR功能性标记。在这些序列中共搜索出12 242个SSRs,分布于10 325条Unigenes中,出现频率为9.63%。茶树转录组SSRs的平均长度为16 bp,平均分布频率是1/3.68 kb。在茶树转录组的SSRs中,二核苷酸重复是主要的类型,占总SSRs的63.78%。茶树转录组SSRs共包含181种重复基元,二核苷酸重复基元CT/AG和TC/GA是优势重复基元类型,分别占总SSRs的23.84%和23.58%。同时对这些SSR的可用性进行了评价。  相似文献   

3.
测序技术的进步有力促进了基因组学的研究进展。近年来,已有7个茶树参考基因组相继发表,但不同基因组间SSR的数量和特征尚不清楚。通过对7个茶树全基因组SSR位点的鉴定和比较分析发现,茶树中二核苷酸重复单元SSR最多,其次是三核苷酸重复单元,所有品种Ⅰ类SSR均含量均低于Ⅱ类SSR。品种间SSR数量在391 815至595 417之间变化,全基因组SSR密度则从131.94 Mb-1到207.66 Mb-1不等,不同染色体间存在明显差异。与基因组二核苷酸重复最多不同,CDS区SSR密度更低,且以三核苷酸重复单元为主。二核苷酸和三核苷酸重复最多的类型分别为AG/CT和AAT/TTA。同时发现,不同品种基因组间存在丰富的多态性SSR位点。对这些特征的揭示和多态性SSR的鉴定,将为茶树遗传图谱构建、遗传多样性分析和重要性状的遗传机制解析奠定基础并提供支撑。  相似文献   

4.
为探究牦牛全基因组中重复序列的组成特征,本研究以染色体水平的牦牛全基因组(BosGru3.1)为研究对象,利用生物信息学方法对牦牛基因组中的单纯型SSRs序列进行了检测,并对其分布特征进行综合分析。结果表明:1)在牦牛全基因组(2.83 Gb)中,共筛选出778 413个单纯型SSRs,总长度为14.42 Mb,占全基因组序列总长的0.51%,相对频率和相对密度分别为274.92 loci/Mb和5 094.43 bp/Mb。2)牦牛31条染色体中,1号染色体所含的SSRs数量最多(48 592个,6.24%),29号染色体所含的SSRs数量最少(11 758个,1.51%),染色体DNA序列长度与其所含SSRs数量呈显著正相关(P<0.001)。3)6种重复类型的单纯型SSRs在牦牛基因组中分布不均匀,其中单碱基重复类型的SSRs数量最多(320 592个,41.19%),其次是两碱基(197 824个,25.41%)、三碱基(130441个,16.76%)、五碱基(75 056个,9.64%)、四碱基(52 523个,6.75%)和六碱基(1 977个,0.25%)。4)各重...  相似文献   

5.
[目的]开发银鲳分子标记技术。[方法]通过对银鲳(Pampus argenteus)进行高通量转录组测序(RNA-seq)获得银鲳转录组原始试验数据,经过拼接后,获得3 715 603条unigene序列。采用生物信息学分析软件MISA对所有unigene进行简单重复序列(simple sequence repeat,SSR)位点鉴定。同时,利用软件对银鲳转录组SSR的多态性进行评价。[结果]银鲳转录组水平上,共鉴定出107 007个SSR位点,分布在97 289条unigene中,发生频率为2.62%,SSR平均密度为476个/Mbp。在银鲳转录组SSRs中,单核苷酸与二核苷酸重复序列为主要重复类型,分别占总SSRs的48.14%和34.10%。银鲳转录组数据中SSR序列共包括424种重复基元类型,单核苷酸重复基元A占较高比例,占同一重复类型SSRs的49.57%,二核苷酸重复基元TG/AC和三核苷酸重复基元GAG/AAC是优势重复基元,分别占同一重复类型SSRs的42.43%和9.61%。重复序列长度在12 bp以上的SSR标记位点数占总SSR的76.95%,具有丰富的多态性。[结论]银鲳SSRs位点具有极大的可开发性,可为银鲳遗传多样性研究、遗传图谱构建及分子辅助育种提供有效工具。  相似文献   

6.
对基于高通量测序拼接获得的99 741条四球茶嫩叶Unigenes进行了SSR(simple sequence repeats)位点分析,共揭示了23 732个SSR位点,分布于18 552条Unigenes中,SSR发生频率为23.79%;含有SSR位点的Unigenes的总长度为226 188 bp,SSR位点间的平均距离为1/2.07 kb,重复长度平均长度为9.53 bp。在四球茶转录组SSR中,二核苷酸重复和三核苷酸重复是主要的重复类型,分别占总SSRs的47.53%和25.92%;在181种重复基元类型中,优势重复基元分别是AG/CT、A/T、ACC/GGT,分别占总SSRs的41.38%、22.10%和6.49%,共占总SSRs的比例达69.97%。  相似文献   

7.
本研究利用巴西橡胶树这一重要产胶植物的基因组文库进行了简单重复序列 (SSRs),也即微卫星序列的分离鉴定。对来自无性系 GT1 的小插入基因组文库进行 SSRs(AC/TG 及 CT/GA 基序)筛选鉴定共获得 154 个克隆。采用载体通用引物及重复序列进行 PCR 扩增发现,其中 114 个为阳性克隆。限制性酶切分析结果显示,这些阳性克隆中有 6 个为重复拷贝,故予以剔除。之后,对剩余 108 个克隆中的 50 个进行了序列分析。此外,试验中对来自优良无性系 RRII105 的大插入基因组文库也进行了筛选。所获 24 个阳性克隆的测序结果也证实了橡胶基因组中微卫星序列的存在。经过最终的序列分析,本研究共鉴定出 67 个具有不同特点的简单及复合型微卫星序列,其中 59 个来自 GT1,其余 8 个来自 RRII105。所检测到的重复基序包括二核苷酸(TG/AC,AG/TC,TA/AT),三核苷酸(AAG,AGG,ATT),四核苷酸(GAAA,AAGG,ATCC,TAAA,AAAT),以及一个五核苷酸(GAAAT)。与其它作物的报道结果类似,在橡胶基因组中也观察到大量的 CT/GA 重复。  相似文献   

8.
为开发马口鱼(Opsariichthys bidens)多态性简单重复序列(simple sequence repeat, SSR)标记,利用微卫星识别工具(microsatellite identification tool, MISA)搜索统计马口鱼全基因组SSR,采用生物信息学方法对其分布特征进行比较分析;选取39个三核苷酸SSR位点设计引物进行多态性检测。结果显示:马口鱼全基因组中SSR总数量为304 870个,占全基因组长度的0.10%;二核苷酸SSR为马口鱼基因组中的主要重复类型。5种重复类型SSR数量为二核苷酸SSR>四核苷酸SSR>三核苷酸SSR>六核苷酸SSR>五核苷酸SSR。内含子区SSR数量最多,为93 380个;5′非翻译区SSR数量最少,为622个。各区域SSR数量分布情况为内含子区>基因间隔区>启动子区>3′非翻译区>编码区>5′非翻译区。编码区数量最多的是三核苷酸SSR,而其他5个区域最多的是二核苷酸SSR。各重复类型拷贝数分布范围为5~350,主要集中在5~30。通过筛选得到15对多态性引物,在野生群...  相似文献   

9.
为了开发丹参表达序列标签微卫星(EST-SSR)功能性分子标记,从公共数据库GenBank中下载获得丹参EST序列10288条,在剔除低质量和冗余的序列后,得到全长为292.561 kb的无冗余EST序列5073条.在这些序列中共发掘出628个SSR,分布在528条EST中,出现频率是10.4%,平均长度为14.47 bp,平均分布频率为每0.47 kb分布一个SSR位点,其中含SSR位点的EST长度主要分布于401~600 bp与601~800 bp之间.在检索出的SSRs中,二核苷酸是主要重复类型,占SSR总数的72.45%;其次是三核苷酸,占SSR总数的26.75%.二核苷酸类型(AG)n、(AT)n和(AC)n和三核苷酸类型(AAG)n、(AGC)n基元是SSR的主要重复类型.本研究为丹参EST-SSR标记的开发和进一步应用提供参考.  相似文献   

10.
摘 要:基因组SSR标记开发成本高,难度大,费时费力,采用公共数据库登录的表达序列标签(expressed sequence tag, EST)开发SSR是一种相对简便、经济的途径.本文首先对NCBI数据库下载获得的2 204条牡丹EST序列经比对,去冗余后得到1 658条牡丹EST序列,然后利用MISA软件对这些序列进行筛查,结果在其中901条EST序列中发掘出1 111个SSR,出现频率为67.00 %,平均分布距离为1 004 bp.在牡丹EST-SSR中,单核苷酸重复是最主要的重复类型(89.38%),其次是二核苷酸重复(6.67%)和三核苷酸重复(3.78%),四核苷酸重复和六核苷酸重复分布极少,没有五核苷酸重复.A/T是优势重复基元,占微卫星总数的87.76 %,在所有的SSR中,重复次数在8-30 bp的占85.15%.长度为26-31bp的占49.86%.  相似文献   

11.
大鼠全基因组微卫星分布特征研究   总被引:2,自引:0,他引:2  
大鼠(Rattus norvegicus)一直是医学和药学研究中良好的模式生物,其全基因组是继人和小鼠之后第3个被测定的哺乳动物。利用生物信息学软件对大鼠全基因组1~6 bp不同类型重复微卫星进行搜索及统计,表明大鼠全基因组微卫星序列共1 483 525个,其序列长度占全基因组的1.41%。大鼠全基因组微卫星分布频率以12号染色体最高,其次是10号染色体,最低的是X性染色体。大鼠微卫星数量与染色体DNA序列长度具有相关性(r=0.978,P0.000 1),微卫星分布具有随机性。大鼠全基因组不同重复类型微卫星表现为二碱基(46.9%)单碱基(22.6%)四碱基(17.7%)三碱基(8.4%)五碱基(2.4%)六碱基(2.0%),单碱基、二碱基、三碱基、四碱基、五碱基、六碱基优势微卫星类型分别是A、AC、AGG、AAAC、AAACA、ACAGAG。本研究为大鼠全基因组微卫星筛选及进一步的研究提供数据支持。  相似文献   

12.
采用生物信息学方法对茶树(Camellia Sinensis)叶部不同发育阶段(单芽/三叶)转录组中的EST-SSR位点信息进行分析,以期为茶树分子标记辅助育种提供有效的参考。利用SSRFINDER软件,对茶树芽叶转录组的高通量测序获得的97454条Unigenes序列(100.91Mb)进行大通量SSR位点的筛选,共获得36249个SSR位点,分布于27913条Unigenes序列中,其发生频率为28.64%,平均分布密度为1/2.78 kb。在茶树芽叶的转录组序列中共发现962种碱基重复基元,其中占主导的是以(AG/CT)n为主(占总SSRs的23.78%)的二核苷酸重复,占到总SSRs的59.19%,其次是三核苷酸和单核苷酸重复,其占比分别为20.92%和13.13%。茶树芽叶转录组所含不同重复基元SSRs的平均长度,相对全器官转录组较短,其中占比最高的是重复长度为18 bp的中长重复序列,占到总SSRs的23.37%,而大于25 bp的较长序列重复极少。同时对茶树不同器官转录组测序的SSR分布特性进行了分析比较,以期为后续的分子标记开发提供参考。  相似文献   

13.
牡丹EST资源的SSR信息分析   总被引:1,自引:0,他引:1  
首先对NCBI数据库下载获得的2204条牡丹EST序列进行比对,去冗余后得到1658条牡丹EST序列,然后利用MISA软件对这些序列进行筛查,结果在其中901条EST序列中发掘出1111个SSR,出现频率为67.00%,平均每1 004bp出现1个SSR.在牡丹EST-SSR中,单核苷酸重复是最主要的重复类型(89.38%),其次是二核苷酸重复(6.67%)和三核苷酸重复(3.78%),四核苷酸重复和六核苷酸重复分布极少,没有五核苷酸重复.A/T是优势重复基元,占微卫星总数的87.76%.牡丹EST-SSR基元类型的重复次数主要集中在6~30次,其基元长度主要集中在26~31bp.  相似文献   

14.
牙鲆EST资源的SSR信息分析   总被引:4,自引:0,他引:4  
应用生物信息学方法,对牙鲆EST-SSRs的分布频率及碱基重复特点进行了归纳与分析。结果表明,5 927条牙鲆非冗余EST序列通过在线搜索共检索出471个SSRs,分布于390条EST中,出现频率为7.95%,平均分布距离为7.9 kb。包括了112种重复基元,其中二核苷酸重复基元占主导地位,占总SSR的59.02%。AC是二核苷酸中的优势基元,占二核苷酸重复类型的16.91%。三核苷酸重复基元、四核苷酸重复基元和六核苷酸重复基元分布比较分散,三核苷酸重复基元中GAG数量最多,但仅占三核苷酸重复类型的7.26%。研究结果为牙鲆EST-SSR标记的开发及应用奠定了理论基础。  相似文献   

15.
红螯螯虾转录组中的SSR位点信息分析   总被引:1,自引:0,他引:1  
对红螯螯虾转录组测序数据进行分析,并开发引物通过PCR扩增和毛细管电泳检测,进行了引物多态性和通用性分析。从67 369条Unigenes中共检测到22 727个简单重复序列(SSR)位点,并对包含SSR序列的Unigenes进行功能注释。结果表明,红螯螯虾转录组中微卫星序列的类型较为丰富,其中二核苷酸和三核苷酸重复类型出现频率较多,分别占总SSR出现频率的52.67%和44.25%;四核苷酸、五核苷酸和六核苷酸重复类型出现频率较少,分别占总SSR出现频率的2.62%、0.23%和0.24%。SSR重复类型共有68种,其重复次数的范围为5~84次。筛选出SSR引物5对,对浙江本地及台湾2个群体的60个样品进行遗传多样性分析,每对引物平均产生5.6个多态性片段。本研究结果为深入开发红螯螯虾功能性SSR标记奠定了基础,也为开展红螯螯虾分子标记辅助选育提供支持。  相似文献   

16.
本研究利用巴西橡胶树(Hevea brasiliensis)这一重要产胶植物的基因组文库进行了简单重复序列(SSRs),也即微卫星序列的分离鉴定。对来自无性系GTl的小插入基因组文库进行SSRs(AC/TG及CT/GA基序)筛选鉴定共获得154个克隆。采用载体通用引物及重复序列进行PCR扩增发现,其中114个为阳性克隆。限制性酶切分析结果显示,这些阳性克隆中有6个为重复拷贝,故予以剔除。之后,对剩余108个克隆中的50个进行了序列分析。此外,试验中对来自优良无性系RRII105的大插入基因组文库也进行了筛选。所获24个阳性克隆的测序结果也证实了橡胶基因组中微卫星序列的存在。经过最终的序列分析,本研究共鉴定出67个具有不同特点的简单及复合型微卫星序列,其中59个来自GT1,其余8个来自RRII105。所检测到的重复基序包括二核苷酸(TG/AC,AG/TC,TA,AT),三核苷酸(AAG,AGG,A1T),四核苷酸(GAAA,AAGG,ATCC,TAAA,AAAT),以及一个五核苷酸(GAAAT)。与其它作物的报道结果类似,在橡胶基因组中也观察到大量的CT/GA重复。  相似文献   

17.
油松胚珠转录组微卫星特征分析   总被引:1,自引:0,他引:1  
为利用微卫星分子标记技术进一步研究油松胚珠发育分子调控机制以及微卫星对油松胚珠发育的影响,本文以前期高通量测序结果为基础,用MISA软件对所获得的转录组数据进行SSR位点的发掘和分析,为后续研究提供重要信息资源和数据保障。得到的1412个SSR位点存在于1274条序列中,平均每2.15kb出现一个SSR。油松胚珠转录组微卫星中存在87种重复基元,其中(A/T)n比例最高,约占45.89%;出现频率较高的重复类型是单核苷酸(46.88%)和三核苷酸(34.99%)重复。所得微卫星多为长度<20bp的短重复序列,≥20bp仅占总数的5.67%,重复序列出现频率与长度呈负相关。所得的SSR位点大部分位于非编码区,位于编码区的仅232个,有18个跨越了编码区和非编码区;编码区中占比例最高的是三核苷酸重复序列(105个,45.26%)。   相似文献   

18.
为了更好地了解云南松基因组特征,分析了云南松基因组中微卫星序列的分布特征,采用FLAF-seq测序技术,共获得1 970条微卫星重复序列,利用MISA通过对Unigene序列的分析,鉴定出7种类型的SSR。7种微卫星序列中主要以单碱基重复类型为主,共1 104个,约占重复序列总数的56.04%,其次是双碱基和三碱基重复类型,分别占总数的27.66%和11.68%,四碱基重复类型数量30个,占重复序列总数的1.52%,五碱基、六碱基重复类型在总重复序列中占比最少,均为0.2%,混合微卫星占2.7%。在单碱基重复类型中占优势的重复单元是A/T碱基,双碱基重复类型中占优势的重复单元是(AT)_n/(TA)_n碱基,三、四、五碱基重复类型中,占优势的重复单元不明显,但几种碱基重复类型中,都包含着丰富的A和T。所得到的微卫星重复序列中以长度20bp序列的微卫星数量最多,微卫星长度≥20bp的只占总数的10.81%。可为后续云南松遗传多样性的研究及SSR引物筛选等提供一定的理论依据。  相似文献   

19.
葡萄全基因组SSR分析和数据库构建   总被引:5,自引:0,他引:5  
利用Perl语言开发了用于探寻基因组SSR的程序SSRFinder,并利用其从法国国家基因测序中心(Genoscope)公布的欧亚种葡萄(Vitis vinifera L.)黑比诺品系PN40024的基因组序列中检索到114 520个SSR.其中含单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复单元的SSR数目分别为37 648(329%)、30 123(263%)、18 705(163%)、14 566(127%)、3 492(30%)和9 986(87%)个.在各类SSR中,不同核苷酸组成的重复单元频率间存在较大的差异,其中富含A/T重复单元的SSR频率最高,而富含C/G重复单元的SSR频率最低.SSR在基因组上主要分布在基因间隔区,其次是基因的非翻译区,在编码区的分布密度最小.三核苷酸和六核苷酸SSR在翻译区的分布密度明显高于其他类型的SSR.利用这些SSR序列共设计出80 065(699%)对SSR引物.另外,本研究开发了一个基于Web界面的SSR数据库DGSSR,收录和注释全基因组与EST的SSR,并提供了查询界面,网址为http://wwwyaolabshcn/ssr.  相似文献   

20.
利用数据库中大白菜的部分基因组序列及其注释结果,对大白菜功能基因编码区分布的SSRs类型进行了分析。结果表明,编码区的SSRs以3核苷酸重复的最多,其次为6核苷酸重复的;各种基序的SSRs类型在基因编码区分布的数量有很大差异;另外编码氨基酸的三核苷酸SSRs在11944个基因编码区前100bp、中部及后100bp的分布也有较大差异。说明大白菜基因编码区的SSRs具有相位和极性,其原因在于编码氨基酸的需要。正是这种相位和极性引起大白菜基因编码区SSRs分布的不均一性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号