共查询到20条相似文献,搜索用时 15 毫秒
1.
《南京农业大学学报》2014,(6)
通过生物信息学分析方法,利用广泛使用的基因芯片技术产生的数万个基因表达数据,揭示基因的功能和相互作用。聚类分析是一种主要的生物信息学分析方法,能高效发掘功能一致的基因。针对基因表达谱聚类分析方法较多、应用者选择方法困难的问题,本研究利用3组基因表达谱模拟数据和1组酵母菌基因表达实际数据,通过Caliński-Harabasz指数、灵敏值和分类正确率3个指标,比较了平滑样条聚类、数量性状关联聚类和局部逼近模糊聚类法3种经典方法。结果表明:平滑样条聚类法的Caliński-Harabasz指数平均数最大,灵敏值平均数最小,分类正确率最大,为最优方法;数量性状关联聚类次之,局部逼近模糊聚类最差。这一结果为今后基因表达谱数据聚类分析方法选择提供了参考依据。 相似文献
2.
3.
一、引言本文比较系统、具体的介绍了用计算机对根瘤菌作聚类分析研究的方法和原理。指出了选择菌株和分类特征时要注意的问题,介绍了聚类分析过程中的数据整理、特征编码、相似系数的计算、计算机分类和选择鉴定特征的步骤和方法,用活力差系数 DV(Vigour)和状态差系数 Dp(Pattern)对菌株之间的差异作了分析。 相似文献
5.
多种时序NDVI重建方法比较与应用分析 总被引:4,自引:0,他引:4
【目的】NDVI时序数列能够模拟植物的生长过程,反映其生长状况。目前重建NDVI时序数列的方法有很多,由于模型和参数的不同导致结果存在不确定性以及偏差。本研究旨在对比3种模型(Whittaker平滑、HANTS和Savitzky-Golay滤波)在物候提取和复种指数提取中的应用,以探讨各模型的优缺点。【方法】采用16 d间隔的MODIS MOD13Q1 2000-2012年陕西地区影像,利用3种模型拟合重建NDVI时序数列。首先,将研究区划分为3个气候区,每区分别选择林地和耕地两个采样点,视觉比较各采样点3种模型拟合效果。其次,通过均方根误差、相关系数和信噪比对比各模型拟合精度,并探讨不同植被类型之间拟合精度的差异。然后,采用动态阈值法提取13年植被物候参数(生长开始日期SOS、生长结束日期EOS、生长周期LOS),对比模型提取不同植被类型物候参数均值和标准差的差异。最后,利用二次差分算法和提取规则获取陕西13年复种指数,对比3种模型提取和统计年鉴计算复种指数之间的差异。【结果】Savitzky-Golay滤波拟合精度较高,复种指数提取精度较高,但是提取物候参数方面存在较大误差;HANTS提取物候参数效果较好,但参数设置复杂以及精度较差;Whittaker平滑参数设置简单,能有效降低原始影像的信噪比,在精度和物候参数提取均表现良好;均方根误差和相关系数作为精度检验的标准,二者存在负相关,相关系数比均方根误差更灵敏。【结论】Whittaker平滑能够很好地平衡NDVI时序数列的保真度和粗糙度,在提取物候参数方面表现良好,在提取复种指数方面还有待进一步研究。 相似文献
6.
综合模糊聚类分析方法 总被引:1,自引:0,他引:1
吉日嘎巴特尔 《内蒙古农业大学学报(自然科学版)》1994,(1)
本文提出了聚类变量和聚秩变量的两个概念,其中聚类变量是用来描述n个样本被分成m类以后的阶段聚类结果,当两个样本属于同类时,该两个样本间的聚类变量取值为“1”,否则取值为“0”;聚秩变量是用来描述整个系统聚变过程,两个样本间聚秩变量的取值为该两个样本在n个样本由n类聚至1类过程中的先后次序。对不同聚类结果的n维聚类(秩)变量矩阵进行加权处理,得到综合相似矩阵,经过模糊等价变换得到样本隶属度矩阵,通过选取适当的截值,即可得到含着原来聚类结果综合信息的模糊综合聚类分析结果。 相似文献
7.
8.
以山西省4638种昆虫在7个地理小区的分布、内蒙古7766种昆虫在14个地理小区的分布和中国16804属昆虫在67个生态区域的分布3组数据为样本,用传统的层层合并的相似性聚类分析法(SCA)和新的不需合并的多元相似性聚类分析法(MSCA)进行运算分析,对比结果表明,不合并法都能得到既符合统计学逻辑,又符合地理学、生物学逻辑的结果;合并法在参与小区较少时,还能够得到与不合并法类似的结果,随着参与小区的增多,聚类结构发生变化,以致聚类功能彻底丧失。无论两种聚类结果差异大小,其性质都迥然不同:不合并法的相似性系数是固有的、互相独立的、同时存在的,聚类结果是所有小区之间关系亲疏、距离远近的状态;合并法的每个相似性系数都是合并的依据或结果,前一个系数是后一个系数产生的条件,后一个系数是前一个系数消亡的结果,严格按照顺序,当最后一个系数产生时,前面所有系数和所有小区都已不复存在,聚类结果只是记录不断合并、不断消亡的过程。因此在肯定合并法历史价值的同时,认为申效诚等创建的多元相似性系数公式及多元相似性聚类分析法摈弃合并降阶这一产生偏差和错误的根源,能够得出相对客观的聚类结果,是生物地理学研究领域有效的聚类分析工具,必将推动生物地理学定量研究迈入一个新阶段。 相似文献
9.
采用地积累指数法、内梅罗综合污染指数法和潜在生态危害指数法对研究区域内不同功能区和不同海拔地区的8种重金属污染程度进行了评价,并对3种方法的评价结果进行了综合比较.结果表明:5个功能区被污染程度由大到小分别为:工业区>交通区>公园绿地区>生活区>山区;8种元素的综合污染程度由大到小为:Hg>Cd>Cu>Cr>Pb>Zn>As>Ni,8种元素对该地区整体造成中度污染;随着海拔的增加,8种重金属污染程度迅速降低. 相似文献
10.
本研究在湖北省安陆市水寨试验站对12个籼稻品种进行区组实验的基础上,对12个品种的产量进行了统计分析并对单产和主要产量性状和植物性状进行了聚类分析,以评价各个品种之间的优劣,并试图利用统计方法建立一种客观评价品种之间优劣的方法。研究结果表明利用统计方法可以对水稻区组试验数据产量的显著性进行评判,利用聚类分析可以对品种产量的结果进行合理的分类并可以结合产量数据对品种进行客观评价。 相似文献
11.
基于聚类分析的数据挖掘方法研究 总被引:1,自引:0,他引:1
《山东农业大学学报(自然科学版)》2017,(1)
针对FCM算法的聚类效果易受其初始中心位置影响和易陷入局部最优的缺点,将灰狼优化算法和FCM结合,提出一种基于GWO优化FCM的聚类分析方法。以KDD CUP99数据集为研究对象,研究结果表明,与PSO、GA和SA算法相比较,GWO算法聚类分析的准确率和误判率更低,具有更快的收敛速度,效果更优,从而为数据聚类分析提供新的方法和途径。 相似文献
13.
14.
15.
16.
重庆不同产区烤烟化学成分的比较与聚类分析 总被引:2,自引:0,他引:2
用重庆12个烤烟种植县(区)的252份烟叶样品,对重庆地区烟叶的化学品质进行了比较分析,并以主要化学成分含量为基础数据,进行了聚类分析.结果表明,①重庆市各烟区的主要化学指标平均值基本都在各成分的适宜范围之内,说明重庆市各烟区的烟叶化学成分比较协调,但不同县(区)生产的烟叶,各化学成分含量的差异显著;②基于品种平均值可以把12个县(区)分为5类,彭水、武隆、奉节和万州属于中糖中氮中碱中氯高钾区,各成分含量均比较适宜,化学品质优良,可以作为卷烟工业原料的最优选择;酉阳、黔江、丰都和南川属于中糖中氮中碱低氯中钾区,各成分含量均比较适宜,化学品质优良;巫山和石柱属于高糖低氮低碱低氯中钾区,烟叶烟碱含量低,可以为某些卷烟品牌提供低烟碱烟叶,满足卷烟工业企业的特殊配方需求;巫溪和涪陵各自独立为一类,还原糖含量偏低,建议优化施肥方案,增施钾肥,适时采收成熟度合适的烟叶,改进烘烤技术,提高烟叶还原糖和钾水平,从而提高烟叶品质. 相似文献
17.
18.