首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
[目的]分析基于最小编码长度的基因数据聚类算法的聚类效果,以期为基因数据聚类提供新的方法。[方法]将基因数据的聚类看成是高维混合数据的聚类,通过对基因数据进行预处理后,再利用主成分分析将基因数据降维,降维后基因数据呈类高斯分布,这样分布的基因数据能够被一个简单的基于有损数据压缩的聚类算法进行有效的聚类,而该基于有损数据压缩的聚类算法是根据聚类后使基因的总体编码长度最小原则对基因进行聚类的。试验中分别利用该新算法与传统聚类算法对酵母和拟南芥基因数据进行聚类,并通过基因聚类内部评价和功能评价来验证该新算法的有效性。[结果]通过利用酵母和拟南芥基因数据对新算法的验证试验表明,该研究中的新算法得到的聚类效果优于传统聚类算法,且避免了聚类数需要主观确定和对初始聚类中心敏感等问题。[结论]该研究结果为基因数据聚类提供了一种全新的聚类方法。  相似文献   

2.
孙彩玉  李春苗  孙梅青  王丽娟 《安徽农业科学》2010,38(32):18054-18055,18194
[目的]研究拟南芥春化作用相关基因FLC的序列。[方法]对拟南芥自然群体的春化反应进行QTL分析,发现拟南芥5号染色体上有一个与开花有关的QTL,再运用序列分析确定它与FLC基因的同源性。[结果]意大利拟南芥与瑞典拟南芥在第27、461、501、638、738、884位碱基上不同。但密码子编码的第9、167、246个氨基酸由于密码子的简并性,编码的蛋白质均相同。[结论]拟南芥具有丰富的遗传多样性,由于FLC基因序列长度高度保守、碱基变异位点丰富密码子的简并性,它们均编码同一种氨基酸,对拟南芥生长没有影响。  相似文献   

3.
[目的]发掘植物海藻糖合成途径关键酶基因,探究其编码蛋白TPS活性,为作物遗传改良抗多种胁迫提供优良的候选基因。[方法]本研究基于干旱条件下从甘薯转录组数据库中得到一条与拟南芥AtTPS1基因高度同源的Unigene序列,通过RT-PCR技术克隆了甘薯TPS基因。利用生物信息学软件分析序列特征,酵母互补试验鉴定编码蛋白TPS活性。[结果]IbTPS1基因cDNA序列全长2 811bp,编码936个氨基酸,且具有典型的GT1-TPS和HAD-TPP结构域;生物信息学预测表明IbTPS1编码的蛋白是一个不稳定亲水性蛋白,无信号肽,定位于细胞质中;二级结构元件多以无规则卷曲和α-螺旋为主;酵母互补实验证明表达IbTPS1基因的TPS突变酵母菌株(tps1Δ)和TPS,TPP双突变酵母菌株(tps1Δtps2Δ),以葡萄糖为唯一碳源的尿嘧啶缺失培养基上可恢复生长。[结论]证实甘薯IbTPS1基因的编码蛋白具有生物活性。  相似文献   

4.
[目的]对陆地棉水通道蛋白基因GhNIP5.1进行生物信息学分析,为深入研究陆地棉水通道蛋白的功能提供研究基础。[方法]利用电子克隆的方法,获得棉花 GhNIP5.1基因的开放阅读框序列,并对该序列进行了生物信息学分析;利用已公布的棉花基因组测序结果,搜索获得 GhNIP5.1基因的编码区序列。[结果]序列分析表明,所获得 cDNA序列具有完整的897 bp的开放阅读框,编码298个氨基酸残基;该氨基酸序列具有 MIP超家族典型的 NPA保守序列;它同葡萄和拟南芥的NIP5.1氨基酸序列的一致性最高,分别为89.3%和83.2%,在拟南芥 NIP家族9个成员中,GhNIP5.1蛋白的氨基酸序列同 AtNIP5.1同源性最高;该蛋白的三维结构也同拟南芥AtNIP5.1的非常相似;GhNIP5.1基因的编码区全长2067 bp,包含4个外显子和3个内含子,所有内含子的左右边界均为 GT-AG结构。[结论] GhNIP5.1基因可能具有同拟南芥AtNIP5.1类似的生理功能。  相似文献   

5.
[目的]对陆地棉水通道蛋白基因GhNIP5.1进行生物信息学分析,为深入研究陆地棉水通道蛋白的功能提供研究基础。[方法]利用电子克隆的方法,获得棉花GhNIP5.1基因的开放阅读框序列,并对该序列进行了生物信息学分析;利用已公布的棉花基因组测序结果,搜索获得GhNIP5.1基因的编码区序列。[结果]序列分析表明,所获得cDNA序列具有完整的897 bp的开放阅读框,编码298个氨基酸残基;该氨基酸序列具有MIP超家族典型的NPA保守序列;它同葡萄和拟南芥的NIP5.1氨基酸序列的一致性最高,分别为89.3%和83.2%,在拟南芥NIP家族9个成员中,GhNIP5.1蛋白的氨基酸序列同AtNIP5.1同源性最高;该蛋白的三维结构也同拟南芥AtNIP5.1的非常相似;GhNIP5.1基因的编码区全长2 067 bp,包含4个外显子和3个内含子,所有内含子的左右边界均为GT-AG结构。[结论]GhNIP5.1基因可能具有同拟南芥AtNIP5.1类似的生理功能。  相似文献   

6.
王斌 《安徽农业科学》2011,39(33):20368-20370
[目的]建立一种改进的基于聚类的模糊决策树,并研究其在玉米种质筛选中的应用。[方法]采用一种新型的基于聚类的决策树算法,该算法针对传统的决策树算法不能处理无类别样本的这一不足,进行了改进。同时,将改进算法应用在玉米品种的筛选问题中,通过对叶面积、株高、干重、钾利用率等指标的衡量,筛选出耐低钾性较强的玉米种子。[结果]该算法在玉米种质的筛选上,适用性强且性能较优。[结论]在今后工作中还需进一步验证比较改进的基于聚类的模糊决策树与传统的模糊聚类决策树的性能,并将其应用在更多的实际问题中。  相似文献   

7.
基于聚类的决策树在玉米种质筛选中的应用(英文)   总被引:1,自引:0,他引:1  
[目的]建立一种改进的基于聚类的模糊决策树,并研究其在玉米种质筛选中的应用。[方法]采用一种新型的基于聚类的决策树算法,该算法针对传统的决策树算法不能处理无类别样本的这一不足,进行了改进。同时,将改进算法应用在玉米品种的筛选问题中,通过对叶面积、株高、干重、钾利用率等指标的衡量,筛选出耐低钾性较强的玉米种子。[结果]该算法在玉米种质的筛选上,适用性强且性能较优。[结论]在今后工作中还需进一步验证比较改进的基于聚类的模糊决策树与传统的模糊聚类决策树的性能,并将其应用在更多的实际问题中。  相似文献   

8.
不同生态型拟南芥FLC基因的序列分析   总被引:1,自引:0,他引:1  
[目的]对拟南芥春化作用相关基因FLC的序列分析。[方法]先期经过对拟南芥自然群体的春化反应的QTL分析,发现拟南芥5号染色体上有一个与开花有关的QTL,本实验就是运用序列分析确定它与FLC基因是否具有同源性。[结果]意大利拟南芥与瑞典拟南芥在第27位、第461位、第501位、第638位、第738位、第884位碱基上不同。虽然这些碱基有所不同,但是密码子编码出来的第9个氨基酸、第167个氨基酸、第246个氨基酸,由于密码子的简并性,编码的蛋白质均相同。[结论]拟南芥具有丰富的遗传多样性,其FLC基因序列长度高度保守、碱基变异位点丰富密码子的简并性它们均编码同一种氨基酸对拟南芥生长没有影响。这表明拟南芥的基因序列会受到环境的影响。  相似文献   

9.
[目的]克隆鉴定香蕉类受体蛋白激酶基因。[方法]以香蕉果实cDNA噬菌体文库为材料,筛选出香蕉类受体蛋白激酶基因阳性噬菌体库,对该基因进行克隆和序列分析,并通过原位杂交方法对其进行鉴定。[结果]试验克隆到1个长度为1698bp的香蕉果实类受体蛋白激酶基因,编码563个氨基酸序列。经过Southern杂交证实该基因来自香蕉基因组,是1个多拷贝基因。[结论]该研究结果为进一步研究香蕉类受体蛋白激酶基因在香蕉果实中的功能奠定了基础。  相似文献   

10.
酵母基因表达调控关系的构建及其统计特性分析   总被引:1,自引:0,他引:1  
吉冬梅 《安徽农业科学》2009,37(10):4360-4362
[目的]从复杂网络的角度研究酵母细胞周期调控网络的统计特性。[方法]首先对酵母的细胞周期基因表达数据采用皮尔逊相关性度量,计算基因间的关联矩阵,即建立简单的基因调控网络;同时为了能够得到在宏观角度对大规模的基因调控有一个全貌的了解,进一步分析所建立调控网络的统计特性,通过计算所建立网络的统计特性:即计算网络的聚类系数、平均路径长度和网络的度分布。[结论]发现所建立的网络具有无标度和小世界特性,即所建立的酵母基因调控网络属于复杂网络,这为进一步深入研究基因调控网络的统计学和动力学特性打下了基础。  相似文献   

11.
[目的]分析秦艽基原植物间不同DNA序列的差异,为秦艽药材DNA条形码的筛选和基原鉴定提供分子证据。[方法]采用PCR扩增纯化后直接测序的方法,测定大叶秦艽G.macrophylla pall.、麻花秦艽G.straminea Maxim.、粗茎秦艽G.crassicaulis Duth-ieex Burk.、小秦艽G.dahurica Fisch、黄管秦艽G.officinalis H.Smith5种植物的核糖体DNAITS、叶绿体DNA psbA-trnH核苷酸序列,并作序列同源性分析。[结果]cpDNA psbA-trnH序列长度变异范围为316-318bp,有7种不同的单倍型,单倍型间有7个变异位点,序列的GC含量为21.2%。最大简约树的聚类结果与单倍型反映的结果一致。nrDNA ITS序列长度变异范围为624~625bp。有5种不同的单倍型、单倍型间有12个变异位点,序列的GC含量为59.3%。最大简约树的聚类结果表明,小秦艽与麻花艽聚为一支,大叶秦艽与黄管秦艽聚为一支,粗茎秦艽位于聚类图的最基部。[结论]nrDNAITS序列较适合作秦艽基原植物的DNA分子鉴定。  相似文献   

12.
[目的]探讨我国不同地区福寿螺的遗传多样性和遗传结构。[方法]应用ISSR分子标记技术对我国江苏苏州、福建漳州、广东珠海3个不同地理群体福寿螺的遗传多样性和遗传结构进行了分析。[结果]从77个ISSR引物中筛选出3个引物对福寿螺3个群体60个样品进行扩增,得到33个清晰的扩增位点,多态位点为31个。江苏、福建和广东3个福寿螺群体的Shannon′s指数分别为0.353 6、0.424 70、.279 6,由此分析,其遗传变异主要来自于群体内个体间。福寿螺UPGMA聚类图显示,广东群体和福建群体首先聚在一起,再与江苏群体聚类。3个群体的遗传多样性处于相同水平上,且遗传多样性高低依次为福建群体>江苏群体>广东群体。[结论]3个地区福寿螺群体产生一定的遗传分化,表明福寿螺具有广适性的遗传特性。  相似文献   

13.
[目的]在科技情报资源快速增长的环境下,通过大文本数据分析快速发现研究主题,且进一步挖掘各研究主题下的技术发展与变化,对做出全面快速响应的科技情报工作有着重要的意义。[方法]针对大文本数据,利用Python实现了文本预处理后的LDA模型主题发现与技术演进,首先构建文本预处理泛化模型,实现技术词自动识别处理;然后基于技术词进行LDA模型构建及可视化,来识别研究主题;最后基于技术词构建技术演进的计算模型,来进一步挖掘技术的发展与变化。[结果]文章以SiC技术领域43621项专利为分析对象进行了实践,包括文本预处理、主题发现及可视化、某主题下技术发展和变化分析等全流程,处理畅通且用时很短(案例全程历时约10分钟)。[局限]文章提出的LDA各主题下技术演进模型中,文档只与其相关度最大的主题关联,尚未对文档多主题关联情况下的演进效果进行对比,后续有待进一步优化验证。[结论]文章提出的方法对快速全面把握一个科技领域有着重要作用,通过主题的识别以及主题之下的技术发展变化,可以以不同的颗粒度去研究一个科技领域,并对后续的调研分析提供有价值的线索。  相似文献   

14.
为了传统土地评价过程中影响因子存在连续值时难以构建评价模型的缺点,提高土地评价知识表达的可解释性,通过对语义属性采用多重分支,利用分支的统计显著性的启发式技术来实现剪枝,提出了基于C4.5算法挖掘分类规则。并利用模糊推理的方法,给出模糊匹配程度的概念,计算出被评价土地样本与各C4.5规则匹配的模糊程度,然后从中找出模糊匹配程度最大的所对应的规则,被评价样本即可被评价为该规则的结果所示的土地等级。文章提出了一种基于C4.5算法和模糊判决算法的土地资源评价模型构建方法,通过广东省土地评价数据库的实验结果表明,该方法能够适用于土地评价当中,当选取100条规则作为规则库进行土地评价时,获得了86.67%的数量准确率和84.80%的面积准确率。  相似文献   

15.
许蔼飞  黄世杰  蒋宏霖  范忠  吴晶晶 《安徽农业科学》2010,38(21):11120-11121,11139
[目的]探索烟用香精质量评价的新方法。[方法]采用气相色谱/质谱法(GC/MS)建立烟用香精指纹图谱,对19批次B#烟用香精,计算其相关系数、夹角余弦和程度相似度,并进行聚类分析。[结果]程度相似度算法结合聚类分析能够有效的反映样品间的整体差异。[结论]该方法准确、可行,可作为烟用香精质量评价的一种直观、合理、有效的技术手段。  相似文献   

16.
[目的]为在猕猴桃生产实践中进行品种辨别提供科学依据。[方法]对11种猕猴桃果实与叶片性状进行实地观察,并使用PAUP程序对其进行形态性状聚类分析,研究猕猴桃的分类、区域分布和系统关系。[结果]和平产区猕猴桃属植物果实特征、叶形、叶质和叶表面被毛等方面存在着高度的多态性;通过果实与叶片性状聚类将11个种归成9个大类,聚类结果与现行的分类存在一定的差异。野生猕猴桃与栽培品种之间差异较大,美味猕猴桃与中华猕猴桃亲缘关系比较接近,品种间有交叉。[结论]该研究为充分利用猕猴桃种质资源,培育新品种奠定了基础。  相似文献   

17.
[目的]研究甘蔗F2后代材料间是否存在遗传差异。[方法]采用11条引物对20份蔗茅杂种F2材料进行ISSR分析。[结果]共扩增出121条带,其中110条为多态性带,多态率达90.91%,说明栽培甘蔗与蔗茅杂交F2材料间存在着丰富的变异;供试F2代材料与其母本"崖城89-9"及父本"昆明蔗茅"间的平均遗传相似系数分别为0.71和0.54,且从聚类结果来看,各子代材料均与母本聚为一类,说明母本的遗传物质在子代材料中占绝对优势。[结论]该研究可为甘蔗创新种质材料在甘蔗育种中的应用提供依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号