首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
新一代高通量测序技术发展产生大规模DNA序列片段,快速准确地将短序列比对到参考基因组成为生物信息学重要研究课题之一。针对BWT索引技术序列比对算法研究,提出基于Intel微架构AVX指令集优化BWT算法,通过改进计算方式实现算法并优化。结果表明,应用AVX指令集可减少CPU访存次数,降低算法时间复杂度,提高序列比对效率,为基因数据分析提供更高效快速序列比对方法,加快对全基因组序列处理。  相似文献   

2.
在对生物信息学序列比对理论研究的基础上,将序列比对算法应用到入侵检测模型中,提出一种序列比对攻击特征自动提取新方法.针对Needleman-Wusch算法缺乏攻击知识积累,设计一种基于知识积累的序列比对算法IASA(Information Accumulation Sequence Alignment).新方法首先调整数据去噪并进行数据聚类,使用IASA进行序列比对,使得序列比对的特征片段趋向于更合理结果,再将比对结果所代表的攻击特征转化为IDS规则.实验结果表明,该方法能提高攻击特征生成质量,降低系统误报率.  相似文献   

3.
蛋白质序列的分类是预测新蛋白质序列的结构和功能的重要方法,已有的方法主要基于序列比对或概率后缀树。文章设计一种基于频繁模式的蛋白质序列分类算法CFS,使用每类数据独有的频繁模式代表该类,然后应用各类的频繁模式对测试数据进行分类。试验结果表明,CFS方法可以获得较好的分类精确度,使用频繁模式作为类代表,使得分类更直观,易于理解,而且更具有生物信息学意义。  相似文献   

4.
生物信息学是应用计算机技术将生物化学和分子生物学试验的海量信息转换为数字信息的一门科学,其重点是DNA和蛋白质序列的比对和分析.本文阐述生物信息学的方法学,包括功能基因组、蛋白质组、基因表达谱、生物芯片、靶基因研究等相关技术在药用植物研究上的应用前景.  相似文献   

5.
利用UniGene数据库转录本序列数据,通过生物信息学方法,对已有全长mRNA序列数据的基因进行其转录本5'端序列的比对,获得该基因编码区前所有转录本的启始位点信息.通过7种植物17437个基因的分析表明,植物基因平均在171 bp(mRNA水平上)或174 bp(基因组水平上)的区间内转录启始,转录频率分布基本呈正态分布.为此我们研发了基因转录启始频率分析程序包PIFMaker,并基于以上分析获得的数据,建立了植物基因转录频率数据库(PIFdb,http://ibi.zju.edu.cn/bioinplant/).本研究分析基于该数据库第2版(Release 2.0)的数据.  相似文献   

6.
【目的】通过对双孢蘑菇不同类型核心种质的基因组重测序分析,探讨双孢蘑菇不同类型菌株间基因组存在的差异及开发相关分子标记。【方法】对双孢蘑菇国内外杂交菌株、野生菌株、高产型或优质型传统菌株、棕色菌株、不育菌株等共18株核心种质进行基因组重测序,应用不同的生物信息学处理软件,对测序得到的原始reads序列与双孢蘑菇参考基因组H97序列进行比对,同时基于比对结果进行SNP、SV检测,通过检测结果对多态性标记分布进行统计并实现DNA水平差异基因挖掘和差异基因功能注释等。【结果】样品测序共获得21.63 G数据量,Q30平均达到89.10%。样品的reads与参考基因组H97的比对效率平均为82.50%,基因组覆盖度为96.32%,平均深度分别在33X左右。基于测序数据与参考基因组的比对结果,共检测获得约813 768个SNP,53 840个InDel,平均每个个体获得924个SV变异。【结论】国内外菌株的亲缘关系表明As2796系列与U1系列是世界上并列的两大双孢蘑菇杂交品系。  相似文献   

7.
[目的]本文旨在对菜豆(Phaseolus vulgaris)基因组中CACTA转座元件进行鉴定,分析其序列特征、插入位点特征、进化关系、基因结构和功能基因并进行标记开发,为CACTA转座元件功能研究和应用奠定基础.[方法]基于菜豆的全基因组数据,采用生物信息学方法进行序列鉴定和分析;基于所鉴定的CACTA转座元件插入...  相似文献   

8.
了解植物α-淀粉酶基因的起源,对于理解其在植物中的功能具有重要意义.基于GenBank数据库中植物淀粉酶的核苷酸序列及氨基酸序列,采用生物信息学方法如序列比对和进化树构建对其进行分析,结果发现用2种方法构建的系统发生树较为相似,推测它们之间的进化关系较为一致.同时序列比对结果显示,有2个高度保守的序列区,是α-淀粉酶基因所特有.本研究推测植物α-淀粉酶基因家族起源于一个共同的祖先基因,后又分化为Amy、AmyB家族.  相似文献   

9.
目的对1株从患者标本分离出的具有耐药性的微小脲原体hebnu3h07进行全基因组测序和生物信息学分析,为深入研究微小脲原体的基因组学特征及耐药机制提供依据。方法对从临床分离的微小脲原体hebnu3h07株进行培养鉴定并进行药敏试验,采用Ion torrent高通量测序技术对其进行全基因组测序,再使用相关软件对测序数据进行基因组组装、基因预测与功能注释、共线性分析、直系同源簇(COG)聚类分析、菌株分型和介导耐药的相关基因检测分析。结果微小脲原体hebnu3h07株对数种抗生素表现出不同程度的耐药性,其完整基因组大小为723 292bp,GC含量为25.4%,与现存3株微小脲原体完整序列比对发现其基因组序列较为保守,多位点序列分型属于ST1型,对介导耐药的基因检测发现数个突变位点。结论通过对此株抗生素耐药的微小脲原体的全基因组测序和导致耐药的基因位点分析,丰富了我国微小脲原体基因组数据,为微小脲原体的耐药机制研究提供了依据。  相似文献   

10.
我国自主测序的日本血吸虫基因组工作框架图,共计300多万条DNA序列(reads),供全球开展血吸虫病及其他寄生虫病相关研究的机构和科学家共享.这不仅是我国首次对人体寄生虫展开全基因组测序,也是我国生命科学研究机构首次通过国内生物信息平台向全世界发布大规模基因组序列数据.这不仅表明我国的基因组学和生物信息学研究和技术支撑体系已经在国际上占有重要地位,而且也第一次向世界显示我国科学数据共享技术平台已经具有汇交、集成和发布大规模基因组数据的能力和权威,  相似文献   

11.
本研究根据已公布的禾谷镰刀菌的全基因组信息,以其全基因组蛋白序列为试验材料,通过生物信息学方法,对其候选效应分子及其功能进行预测和分析。首先利用SignalP、TMHMM、Protcomp、big-PI Predictor、TargetP等程序依次预测出其分泌类型的蛋白,再通过其序列大小和半胱氨酸的含量作进一步筛选,最后利用Blastp工具与非冗余蛋白质数据库进行比对,找出数据库中没有蛋白同源性的序列,从而获得候选效应分子。最终对禾谷镰刀菌全基因组的14 038个蛋白序列进行分析,预测了126个符合条件的候选效应分子。本研究通过LTR-FINDER程序对禾谷镰刀菌全基因组内的转座子进行分析,但未发现转座子存在,值得进一步分析研究。本研究采用生物信息学分析方法预测出了禾谷镰刀菌的候选效应分子并查找其基因组内转座子情况,可为进一步研究这些效应分子的功能,了解禾谷镰刀菌进化奠定基础。  相似文献   

12.
《山东农业科学》2019,(10):111-116
葡聚糖酶抑制蛋白(GIP)是辣椒疫霉菌在病理环境下诱导产生的一类蛋白,是病原菌抗性蛋白的一种。本研究根据辣椒疫霉菌全基因组序列,通过生物信息学分析、序列比对获得葡聚糖酶抑制蛋白全长基因序列。以辣椒疫霉高致病菌株SD33全基因组为模板扩增GIP基因cDNA,并对其进行相关生物信息学分析。基因经测序验证后与载体pET28a(+)连接,构建好的重组质粒转化大肠杆菌(Escherichia coli Rosetta),用IPTG诱导表达重组蛋白6×His-GIP。重组蛋白在5 mol/L尿素变性环境下进行亲和层析纯化,对纯蛋白进行透析、复性、浓缩后进行分子排阻层析纯化,并对获得的纯蛋白进行蛋白结晶试验,为进一步阐明GIP作用机理奠定基础。  相似文献   

13.
利用生物信息学方法,对斜纹夜蛾核型多角体病毒Ⅱ型分离株基因组DNA序列进行分析。结果表明,斜纹夜蛾核型多角体病毒Ⅱ基因组DNA含有7个同源重复区,分别包含3~8个64 bp不完全回文序列,在回文序列中心均含有一个Pvu I限制性酶切位点,并且存在多个正向或反向互补的重复序列和与病毒基因组DNA复制相关的motif基序,对7个hrs中40个回文序列进行比对分析,发现其序列的核苷酸一致性高达90%以上。  相似文献   

14.
[目的]对陆地棉PHYB基因有一个全面的认识和生物信息学分析.[方法]在陆地棉异源四倍体标准系TM-1基因组数据库中共鉴定获得2个PHYB基因,这2个基因分别分布在A10和D10亚基因组.利用生物信息学方法对这两个基因进行初步分析.[结果]棉花的PHYB具有其他植物PHYB相同的基序和结构域,不管是数目还是分部位置都比较一致;不同植物的PHYB氨基酸序列同源性比对及构建的进化树都显示棉花的PHYB同可可的在同源性和进化关系上都是最高的,同水稻、玉米等单子叶植物的同源性及进化关系较低;基因结构的比对结果同样显示植物PHYB基因在进化上比较保守;棉花PHYB存在几十个可能磷酸化的位点,这些位点的磷酸化作用可能影响光敏色素的功能及其介导的信号通路.[结论]该研究结果为陆地棉PHYB基因的克隆和功能研究提供了理论基础.  相似文献   

15.
[目的]本文旨在对梨单糖转运蛋白(sugar transporter protein,STP)基因家族成员进行鉴定,分析其序列特性、基因结构、氨基酸序列保守功能域、染色体定位以及组织表达特性,为其功能研究奠定基础.[方法]基于梨的全基因组数据,采用生物信息学方法进行序列鉴定和分析.通过不同糖种类和浓度培养梨花粉来分析糖...  相似文献   

16.
在后基因组时代,常有大规模的生物数据产生。这些生物数据的存贮形式各不相同,特别是与一些特定研究领域相关的数据,与其他数据的存贮形式差异较大。随着数据源的不同,数据模型的规范也不相同,同时,基于这些数据的应用服务各不相同。针对目前生物信息学中存在的异构生物数据现状,提出了一种基于XML Schema集成异构生物信息的方法。  相似文献   

17.
核机器学习方法是一种基于统计学习理论和核函数的机器学习方法.本文阐述了核机器学习方法的基本原理,介绍了目前常用的几种核机器学习方法,给出了构造新的核函数的原则,总结了结构数据核函数的研究现状.在此基础上,以生物信息学为背景,着重指出了当前序列数据的核函数在生物信息学中的应用进展.  相似文献   

18.
锚蛋白重复序列(ankyrin repeats)是普遍存在于生物体中的介导蛋白与蛋白相互作用的一种结构域。具有这种结构域的蛋白参与转录的启动、细胞周期的调控、细胞骨架系统的形成及离子的运输和信号转导。利用生物信息学方法,以杨树最新基因及蛋白序列为基础,通过对毛果杨全基因组中ANK基因的鉴定,获得较为完整的ANK家族信息。同时,对该家族成员的分类、进化、定位、结构和表达进行全面分析,为下一步研究ANK基因的功能提供重要的生物信息依据。  相似文献   

19.
锚蛋白重复序列(ankyrin repeats)是普遍存在于生物体中的介导蛋白与蛋白相互作用的一种结构域。具有这种结构域的蛋白参与转录的启动、细胞周期的调控、细胞骨架系统的形成及离子的运输和信号转导。利用生物信息学方法,以杨树最新基因及蛋白序列为基础,通过对毛果杨全基因组中ANK基因的鉴定,获得较为完整的ANK家族信息。同时,对该家族成员的分类、进化、定位、结构和表达进行全面分析,为下一步研究ANK基因的功能提供重要的生物信息依据。  相似文献   

20.
在后基因组时代,常有大规模的生物数据产生.这些生物数据的存贮形式各不相同,特别是与一些特定研究领域相关的数据,与其他数据的存贮形式差异较大.随着数据源的不同,数据模型的规范也不相同,同时,基于这些数据的应用服务各不相同.针对目前生物信息学中存在的异构生物数据现状,提出了一种基于XML Schema集成异构生物信息的方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号