首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
为研究基于改进EMD距离的信息特征单元聚类方法,本文利用向量空间方法提取信息特征单元,设置EMD地面距离作为不同信息特征单元间的距离,将信息特征单元比作供货商与消费商。为避免利用EMD距离聚类引起的信息特征单元过分割、正例现象增多以及供货商无法供货问题,设置符合特征相似条件的供货商增大权值的相似阈值,利用阈值令运输以低成本的供货商为主,改进EMD距离;利用改进EMD距离算法实现信息特征单元的有效聚类。经仿真平台验证,该方法对文本、股票等不同类型信息特征单元聚类精度达到99%以上,并且聚类过程迭代次数少,聚类性能优。  相似文献   

2.
针对数量大、数据结构复杂、离散度大的样本数据的聚类分析,采用ISODATA算法实现.ISODATA算法是1种基于统计模式识别的非监督学习动态聚类方法,是大样本数据聚类分析常用的方法,但该算法需要预先确定初始聚类参数.本文提出了基于黄金分割法来度量聚类的有效性,该方法能动态计算聚类度量参数,以此实现大样本数据的有效聚类.实验证明:该方法能够合理、有效的进行数据聚类.  相似文献   

3.
针对Gath-Geva模糊聚类算法对初始给定的聚类中心等先验信息较敏感,提出了一种基于直方图局部信息的模糊Gath—Geva聚类新算法.实验结果表明,新算法在彩色图像分割方面,与传统模糊C—Means算法相比,具有较强的分割精度.  相似文献   

4.
【目的】探讨实际问题研究中的不完全数据聚类。【方法】利用相关变量的辅助信息,对缺失数据进行推估,确定其合理的替代值,从而构造出一个“完全”数据集。在此基础上以EM算法循环迭代,参数的估计值和缺失数据的替代值都将逐渐收敛,以相应的贝叶斯后验概率判别个体的归类,进而实现动态聚类。【结果】模拟研究表明,缺值替代法具有较好的收敛性,对有缺失的数据基本都可正确地聚类。【结论】Fisher的鸢尾花花类识别数据验证了缺值替代法的可行性,其聚类的准确性高于缺值删除法,基本接近完全数据聚类。  相似文献   

5.
谱聚类是一种无监督学习的聚类方法,其具有能够收敛至全局最优且适用于任意形状样本空间的优点.然而,传统方法构造的相似矩阵有时难以准确反映出数据之间的近似关系,从而导致聚类结果不佳.粒计算技术能够很好地解决这一问题.通过将数据邻域粒化,从粒子的视角重新衡量数据之间的近似关系,提出了一种基于邻域粒的谱聚类方法.首先,将样本的单一属性通过邻域粒化的方式形成邻域粒子;然后,将属于同一样本的粒子组合构造成粒子向量;接着,利用定义的2种邻域粒距离公式,对构造出的粒向量进行距离度量,并通过径向基函数生成相似矩阵,从而进行谱聚类;最后,使用UCI数据集进行验证,将谱聚类算法与邻域粒结合,从邻域参数和邻域粒向量的距离度量方式2个方面进行性能测试,并与传统聚类算法进行对比.实验结果表明,基于邻域粒构造的相似矩阵在谱聚类中是可行且有效的.  相似文献   

6.
在白细胞图像中,由于白细胞细胞核的存在,直接应用分水岭算法时,往往达不到较好的效果。本文提出一种结合EM聚类的改进分水岭算法。通过将EM聚类获得的图像中细胞核区域替换,然后使用基于距离变换的分水岭分割,确定白细胞区域。对距离变换后的图像采用形态学处理减少了细胞分割中的过分割现象。同时使用细胞核位置的先验条件,合并分水岭分割区域,进一步减小过分割的影响。本文方法提供一种新的将分水岭算法应用于白细胞分割的思路。同时实验证明,方法在分割精度上有着良好的表现。  相似文献   

7.
为了实现管道滑坡灾害危险性的定量评价,以中国石油西南管道沿线64处典型滑坡为例,通过灾害影响因素分析,初步确定评价指标体系备选指标因子,利用贡献率模型,通过样本统计,分析滑坡灾害影响因子的敏感性。按照敏感性大小将影响因子划分为3级,最终保留中、高影响因子中可以通过野外调查手段获取的坡度、坡面形态、土体类型、历史滑塌、现今变形、土体状态、滑体厚度、降雨、地震烈度9个因子,构建了单体管道滑坡灾害危险性评价指标体系,从而为滑坡灾害危险性评价提供了依据。  相似文献   

8.
[目的]分析基于最小编码长度的基因数据聚类算法的聚类效果,以期为基因数据聚类提供新的方法。[方法]将基因数据的聚类看成是高维混合数据的聚类,通过对基因数据进行预处理后,再利用主成分分析将基因数据降维,降维后基因数据呈类高斯分布,这样分布的基因数据能够被一个简单的基于有损数据压缩的聚类算法进行有效的聚类,而该基于有损数据压缩的聚类算法是根据聚类后使基因的总体编码长度最小原则对基因进行聚类的。试验中分别利用该新算法与传统聚类算法对酵母和拟南芥基因数据进行聚类,并通过基因聚类内部评价和功能评价来验证该新算法的有效性。[结果]通过利用酵母和拟南芥基因数据对新算法的验证试验表明,该研究中的新算法得到的聚类效果优于传统聚类算法,且避免了聚类数需要主观确定和对初始聚类中心敏感等问题。[结论]该研究结果为基因数据聚类提供了一种全新的聚类方法。  相似文献   

9.
汪雪红  焦清局  常盼盼  黄继风 《安徽农业科学》2012,(19):10003-10005,10072
[目的]分析基于最小编码长度的基因数据聚类算法的聚类效果,以期为基因数据聚类提供新的方法。[方法]将基因数据的聚类看成是高维混合数据的聚类,通过对基因数据进行预处理后,再利用主成分分析将基因数据降维,降维后基因数据呈类高斯分布,这样分布的基因数据能够被一个简单的基于有损数据压缩的聚类算法进行有效的聚类,而该基于有损数据压缩的聚类算法是根据聚类后使基因的总体编码长度最小原则对基因进行聚类的。试验中分别利用该新算法与传统聚类算法对酵母和拟南芥基因数据进行聚类,并通过基因聚类内部评价和功能评价来验证该新算法的有效性。[结果]通过利用酵母和拟南芥基因数据对新算法的验证试验表明,该研究中的新算法得到的聚类效果优于传统聚类算法,且避免了聚类数需要主观确定和对初始聚类中心敏感等问题。[结论]该研究结果为基因数据聚类提供了一种全新的聚类方法。  相似文献   

10.
【目的】对广东省气象观测数据挖掘分析,以广东省农业气象灾害中的高温为例,预测可能存在的灾害及其等级.【方法】在缺乏灾害判定规则和历史灾情等先验知识的条件下,应用模糊C均值聚类算法(FCM)挖掘得出关键属性的聚类中心和隶属度矩阵,建立灾害等级判定规则,进而通过气象观测数据预测可能即将发生的农业气象灾害及其等级.通过误差反向传播(BP)神经网络算法对气象观测历史数据及同期发布的灾害等级数据进行学习,训练后的网络模型可以准确地揭示内在的灾害发生规律,进而通过气象观测数据精确地预测可能即将发生的农业气象灾害及其等级.【结果和结论】BP和FCM 2种数据挖掘方法在缺乏先验知识的条件下,均可以通过气象观测数据准确预测农业气象灾害,结果对比表明前者预测气象站点灾害等级的精度略优于后者.  相似文献   

11.
改进了面向分类数据的重叠子空间聚类算法(ROCAT),提出了面向分类数据的重叠子空间聚类算法(SCCAT).利用数据凝聚力模型(DCC)代替ROCAT的数据压缩模型以提高算法精度;将源数据集分为样本内数据集和样本外数据集,采取对样本内数据聚类,对样本外数据分类的方法完成聚类来降低算法复杂度.实验结果表明SCCAT在提高算法精度的同时,也降低了算法的时间复杂度和空间复杂度,适用于大规模数据的处理.  相似文献   

12.
时间序列影像能够反映植被的物候信息,有助于大幅度提高植被聚类精度,尤其对于单时相影像上生长特性相似的树种效果尤其明显。动态时间规整算法(DTW)能够解决不等长时间序列的匹配问题,且能够抵抗噪声造成的时间序列中出现的异常值,从而取得更好的相似特征匹配效果。基于6时间序列GF-1影像数据,分别采用DTW和欧式距离(ED)进行时间序列的相似性度量,然后将DTW距离和ED距离运用到K-Means算法中,完成对图像树种的聚类。结果表明:基于DTW-K Means的时间序列遥感影像分类方法能够适用于树种分类,总精度为92.21%,Kappa系数为0.90,均高于ED-K Means方法。  相似文献   

13.
陈志民  李亭  杨敬锋  彭晓琴 《安徽农业科学》2009,37(30):14738-14739
[目的]为提高瓜蓟马病虫害的预警效果。[方法]采用k-mean聚类建立了瓜蓟马预警模型,并针对瓜蓟马数据中在k-mean聚类算法下难以判断的情况,引入了监督信息,即模糊关联规则进行进一步划分。[结果]引入监督信息的k-mean聚类算法的预警准确率比最近邻算法、k-mean聚类和支持向量机预警准确率都要高。[结论]k-mean聚类过程中引入模糊关联规则能较有效地提高预警准确率。  相似文献   

14.
为了在海量信息中为用户提供有价值的信息,个性化在线推荐系统是农业信息化综合服务平台的重要组成部分。Slope One算法因简单高效被许多在线推荐系统使用。对Slope One算法进行研究,并结合农业信息化综合服务平台的特点,提出了农业信息推荐模型。该模型按资源类别把用户评分矩阵划分为评分子矩阵,在此基础上采用杰卡德统一算子距离相似度算法建立用户类别近邻用户,采用改进的双极Slope One算法和Item user average算法相结合的方式对未访问资源进行评分预测,有效降低计算量,并提高了评分预测精度,既适合稠密数据集,又适合稀疏数据集。  相似文献   

15.
聚类分析在科研和商业应用中都有着非常重要的作用。K-均值聚类算法是一种基于样本间相似性度量的间接聚类方法,其不足之处是,它采用均值作为一类的代表点,一个点往往不能充分反映该类的模式分布结构,从而损失了很多有用的信息。研究了一种改进的 K-均值聚类算法,在求样本间距离时,采用核函数距离代替欧氏距离,考虑了各模式间的相关性。试验结果表明,利用改进的 K-均值聚类算法,聚类结果的准确率更高,更稳定。  相似文献   

16.
以每公顷玉米产量数据序列为分析处理对象,对玉米产量的时间序列进行了预测分析。结合线性回归分析技术和聚类分析理论,采用分层聚类算法与AR时序算法相融合的方法,探明影响玉米产量的主要因素,确定分层聚类方案,建立一个基于聚类分析的玉米产量AR时序模型,并对2005—2009年的玉米产量进行了预测。聚类分析后模型预测结果的误差值大多数<5%。  相似文献   

17.
一种改进的K-均值聚类算法的研究   总被引:1,自引:0,他引:1  
聚类分析在科研和商业应用中都有着非常重要的作用。K-均值聚类算法是一种基于样本间相似性度量的间接聚类方法,其不足之处是,它采用均值作为一类的代表点,一个点往往不能充分反映该类的模式分布结构,从而损失了很多有用的信息。研究了一种改进的K-均值聚类算法,在求样本间距离时,采用核函数距离代替欧氏距离,考虑了各模式间的相关性。试验结果表明,利用改进的K-均值聚类算法,聚类结果的准确率更高,更稳定。  相似文献   

18.
针对传统的K-means聚类算法在海量数据分类中,对数据模糊分解区域判定不敏感,容易陷入局部优化解,无法实现海量数据的模糊聚类的问题,本文设计一种用于海量数据分类的模糊区域判定算法,通过计算大数据模糊区域状态特点的参量,进行大数据最优聚类中点的选取,在聚类中心区域创建任意下单个数据的互通,对每个微小数据特征实现互通;通过计算隶属度以及确定聚类数的方式,解决被隐藏在海量数据中的模糊区域真实边界,实现对海量数据模糊区域的聚类求解。结果说明,所提算法能得到精确的模糊聚类效果,提高海量数据的模糊聚类效率。  相似文献   

19.
为提高短期降水量预测的精度,尤其是汛期降水量的准确估计对防洪减灾以及水资源管理都具有很重要的指导意义。将具有较强非线性映射能力的人工神经网络技术用于汛期降水量预测,更符合降水量的随机相关特征,能切实提高其预测精度。将基于密度参数改进传统K-均值算法与径向基函数神经网络(radial basis function,RBF)耦合,提出了一种新的短期降雨量预报模型。并将所构建的模型应用于黑龙江省双鸭山市汛期月降雨量预报中进行验证。RBF神经网络是一种泛化能力较强的前馈型神经网络模型;密度参数可以通过寻找聚类中心至样本平均距离区域内样本的最优密度,使K-均值算法确定的RBF神经网络基函数中心减少波动,消除标准K-均值算法对初始聚类中心的敏感性,提高RBF网络的逼近能力和网络中心的搜索速度。研究结果表明:基于改进径向基函数的降雨预报模型对于预见期2010年、2011年和2012年的汛期(6~9月)降雨量的计算平均相对误差为10.81%,确定性系数为0.95,预报精度比标准K-均值算法和BP神经网络两种模型的计算结果都有所提高。本研究确定的径向基函数能够更好地描述研究区域汛期月降雨量间的映射关系,与标准K-均值算法和BP神经网络两种模型相比,除预报精度有所提高外,其收敛速度更快,这表明本方法能对短期降水预报提供更高的预报精度。  相似文献   

20.
滑坡危险性评价是定量化评价滑坡对油罐破坏效应的重要手段和主动防灾措施,可以将油库的维护方式从盲目被动提升为有预知性的积极防护。以中国南方某覆土油库为研究对象,将现场调研结果和收集的资料相结合,根据滑坡灾害危险性评价指标,建立了覆土油库区域滑坡危险性评价指标体系:对ASTE GDEM 30 m精度数字高程模型(Digital Elevation Model,DEM)、陆地卫星Landsat 5 TM遥感影像进行处理,获得了覆土油库区域坡面分析专题图和植被覆盖专题图;由于滑坡灾害具有群发性的特点,提出利用GIS对DEM栅格转点后导入Matlab进行危险性评价运算的方法,将危险性评价结果重新导入Arc GIS进行点转栅格运算制作了基于模糊综合评判法的区域危险性评价区划图;采用VB+Assess数据库设计了覆土油库区域滑坡危险性评价管理系统,实现了用户登录、数据载入、信息查询、数据资料库、数据下载、危险性评价、系统帮助7个模块功能。该方法对于覆土油罐滑坡灾害危险性评价具有一定的参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号