首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
基于熵权法加权的模糊C均值聚类算法研究   总被引:2,自引:0,他引:2  
针对模糊C均值聚类算法不能区分数据各属性之间的不平衡性,提出了一种基于熵权法加权的模糊C均值聚类算法。该算法首先应用熵权法计算各属性的权重系数,然后对标准化之后的原始数据进行加权,最后应用模糊C均值聚类算法对加权之后的数据进行聚类。实验表明,该算法聚类准确率要明显高于未加权的模糊C均值聚类算法。  相似文献   

2.
针对信息挖掘中的文本自动聚类问题,提出了一种基于模糊向量空间模型的核聚类算法。首先对聚类文本进行模糊特征提取得到模糊特征项集,然后依据模糊特征项集对每篇文本计算特征项的文档频数,进而得出每篇文本的模糊特征向量。最后利用高斯核函数将每篇文本的特征向量映射到高维特征空间,在高维特征空间中利用核聚类算法实施文本聚类。该方法在特征提取时充分考虑了特征项在文档中的位置信息,使自动聚类原则更接近手工聚类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

3.
加权空间模糊动态聚类算法在土壤肥力评价中的应用   总被引:7,自引:0,他引:7  
 【目的】改进和提高空间模糊聚类算法。【方法】首先利用层次分析法得到各属性的权值,然后将权值与空间模糊动态聚类法相结合,最后利用概率统计中的F分布来确定最佳分类,以提高空间模糊聚类算法的智能性。【结果】加权空间模糊动态聚类算法与基于模糊等价关系的传递闭包方法进行比较表明,当λ取0.993时,F值最大,分类效果最好。此时,加权的F值为4.898,未加权的F值为2.957,说明加权的类间的差距比未加权的明显,即该算法聚类准确率要明显高于未加权的模糊聚类算法。【结论】将其改进的算法运用到精准农业的土壤肥力评价中,试验结果与实际情况相符,证明了该算法的有效性。  相似文献   

4.
陈志民  李亭  杨敬锋  彭晓琴 《安徽农业科学》2009,37(30):14738-14739
[目的]为提高瓜蓟马病虫害的预警效果。[方法]采用k-mean聚类建立了瓜蓟马预警模型,并针对瓜蓟马数据中在k-mean聚类算法下难以判断的情况,引入了监督信息,即模糊关联规则进行进一步划分。[结果]引入监督信息的k-mean聚类算法的预警准确率比最近邻算法、k-mean聚类和支持向量机预警准确率都要高。[结论]k-mean聚类过程中引入模糊关联规则能较有效地提高预警准确率。  相似文献   

5.
专家决策权重是确定群决策一致性一个很重要的方面.针对目前服务模糊匹配方法缺乏专家对服务模糊属性一致性考虑,提出一种语言的权熵方法(LWEM),用语言变量来描述每个专家意见的权重.在LWEM及最佳聚类方法的基础上,论述基于熵的聚类方法(EAM),该方法使用模糊距离来计算一致性.实例验证该方法的有效性及灵活性.  相似文献   

6.
【目的】探讨实际问题研究中的不完全数据聚类。【方法】利用相关变量的辅助信息,对缺失数据进行推估,确定其合理的替代值,从而构造出一个“完全”数据集。在此基础上以EM算法循环迭代,参数的估计值和缺失数据的替代值都将逐渐收敛,以相应的贝叶斯后验概率判别个体的归类,进而实现动态聚类。【结果】模拟研究表明,缺值替代法具有较好的收敛性,对有缺失的数据基本都可正确地聚类。【结论】Fisher的鸢尾花花类识别数据验证了缺值替代法的可行性,其聚类的准确性高于缺值删除法,基本接近完全数据聚类。  相似文献   

7.
提出了一种基于数据驱动的系统建模方法,采用减法聚类和模糊C-均值聚类相结合的模糊聚类算法进行前件RBF网络辨识,自适应地获得精确的聚类个数和隶属度参数;用BP算法训练后件网络的权值,从而仅利用输入输出数据,就建立了T-S模糊神经网络模型,在该过程中充分利用了BP神经网络和RBF神经网络的优点。最后用该模型对一个非线性系统进行辨识,用MATLAB进行仿真,结果表明,该方法具有可行性。  相似文献   

8.
【目的】通过分析含水层水位恢复试验数据进行含水层参数估计,为地下水含水层参数估计提供方法支持。【方法】以现有的直线拟合法为基础,应用模糊数学知识,在考虑了地下水系统本身存在的不确定性的基础上,借助正态模糊线性回归推求各含水层参数对应的正态模糊数,通过相应的隶属函数最终给出了在不同置信水平下含水层参数的取值区间,并与其他方法的含水层参数估计结果进行了比较。【结果】基于含水层水位恢复试验数据,通过模糊线性回归,得到了不同置信水平下含水层参数的取值区间,且随着置信水平的增大,参数取值区间不断缩小;实例验证及不同方法估计结果的比较表明,应用正态模糊线性回归法求解含水层参数的方法不仅是可行的,而且更符合实际情况。【结论】用基于水位恢复试验数据的模糊线性回归法估计含水层参数,因充分考虑了含水层参数的不确定性,故估计结果更为准确可靠。  相似文献   

9.
芦兵  孙俊  杨宁  武小红 《南方农业学报》2018,49(11):2342-2348
[目的]利用高光谱技术测定水稻种子的水分含量,为其品质监测和筛选提供参考依据,从而提高水稻良种筛选率.[方法]通过电烘箱恒重法制备120份不同水分含量的水稻种子样本作为研究对象,利用多项式平滑(Savitz-ky-Golay,S-G)算法对原始光谱数据进行降噪平滑处理,采用连续投影算法(Successive projections algorithm,SPA)对预处理后的数据进行特征波长的优选.为提高建模效率,提高各水分含量区间光谱特征值的区分度,使用模糊C-均值聚类(Fuzzy C-means clustering,FCM)算法对各区间的样本数据进行聚类处理,最后利用支持向量回归机(Sup-port vector regression,SVR)定量检测模型建立特征光谱数据与水稻种子水分含量的映射关系.[结果]由于FCM未达到预期的聚类效果,而引入遗传模拟退火算法(Simulated annealing genetic algorithm,SAGA)进行聚类,分别对基于原始特征值、FCM及SAGA聚类的SVR训练结果进行比较,发现基于SAGA聚类的光谱样本数据训练效果更好,预测集决定系数可达0.8956,均方根误差3.75%.由于决定系数不够理想,引入松弛变量降低间隔阈值,最终模型预测集决定系数为0.9286,均方根误差为3.42%,此时模型达最佳性能,能满足实际应用需求.[建议]基于聚类算法,提高光谱数据的准确性;通过合理调整模型参数,提高预测模型性能;推动高光谱农产品检测相关装备的研制.  相似文献   

10.
作者在前期研究工作中提出了一种基于网格的带有参考参数的聚类算法(GRPC),该算法从用户的角度去看待聚类,最大程度地避免用户设置聚类参数的盲目性.本文对GRPC算法在高维性和可伸缩性两方面进行了扩展,将高维数据空间的聚类工作分解到二维数据空间来进行,并采用随机抽样技术来处理大规模的数据集.实验仿真表明,该算法能在三维及其以上的数据空间有效地聚类较大规模数据集.  相似文献   

11.
聚类、粗糙集与决策树的组合算法在地力评价中的应用   总被引:4,自引:1,他引:3  
陈桂芬  马丽  董玮  辛敏刚 《中国农业科学》2011,44(23):4833-4840
 【目的】地力评价方法大多数有一定的主观性,较少考虑土壤各属性间的依赖关系。论文旨在采用数据挖掘方法,寻求地力等级划分的新方法。【方法】结合农安县耕地调查数据,应用K-means聚类方法、Johnson粗糙集属性约简算法与C4.5决策树算法相结合的优化算法评价地力等级。【结果】使用K-means聚类方法,得到最佳学习样本数;使用粗糙集属性约简和决策树相结合的方法,去掉了冗余属性7个,决策树模型共有节点317个,其中叶节点个数为159个,生成规则159条,模型准确率为82.08%。与未聚类和未约简的方法相比,决策树结点个数减少41.62%。【结论】使用该组合算法,在保证模型准确率的同时,降低了算法的时间和空间复杂性,提高了挖掘效率。  相似文献   

12.
基于可变精度的不完备信息系统粗集扩展模型及属性约简   总被引:3,自引:0,他引:3  
在变精度的基础上,定义了变精度的重要性算子和变精度的近似约简等概念,并由此给出了一种基于变精度的属性约简算法.算法既能保证属性约简的准确性,又能通过对相似度α和精度β的调节增加其灵活性,从而得到一个满足相似度和精度要求的近似约简.同时,它也是完备信息系统的属性约简算法的推广(当α=1,β=0时).且通过实例分析说明算法的可行性和有效性.  相似文献   

13.
基于DEM的数字地形分析   总被引:29,自引:0,他引:29  
该文在对数字高程模型(DEM)数据来源及结构、数字地形分析及其应用、基于DEM的地形分析中的不确定性和误差分析的基础上,以日本东北地区岩手县早池峰山为研究对象,美国MicroImage公司开发的TNTmips地理信息系统为工具,日本国土地理院发行的“数字地图25000”为基础数据,研究基于DEM的数字地形特征提取与分析方法,以及DEM精度对地形特征的影响. 研究结果表明:①以DEM为基础可提取多种地形特征,如坡度、坡向、坡面形态、流域边界、水流路径等,这些特征在地理信息系统的支持下均可用图形和属性数据来表示;②DEM水平精度对基于DEM提取的数字地形特征影响表现为:低精度的DEM将导致研究区平均坡度变小、坡度标准差变大;同时,DEM精度对不同坡度区域表现为不同的影响,其结果按坡度大致可划分为3种不同类型,即0°~10°、10°~35°以及大于35°; DEM精度对坡向的影响除平坡外变化较小,其中平坡面积随DEM精度的降低而增大;低精度的DEM将导致水文地形信息受损,这将严重影响流域水文模型参数的确立及水文过程模拟分析的精度.   相似文献   

14.
讨论了粗糙集(rough sets)在数据分析方面的应用,基于粗糙集的数据分析来源于对数据表(即信息系统)的分析。通常我们将信息系统中的属性划分为条件属性和决策属性,这种信息系统又称为决策表。对每一个决策表,都有一系列的决策规则与之相对应,这些相关的决策规则被称为决策算法。将这些决策算法与贝叶斯(Bayes’)定理相比较,从而得出基于粗糙集的数据分析方法优于贝叶斯定理。  相似文献   

15.
为实现渔业专题电子海图的标准化生产与应用,本文以IHO S-57国际电子海图标准为基础,通过分析海图数据模型和数据结构,以及渔业专题信息的主要内容和特点,扩展了数据集信息记录中的数据集标识字段,定义了海洋渔业专题电子海图产品的编码规则,在物标和属性类目中增加了渔业专题物标和专题属性,并添加了部分专题属性项(值),从而设计了渔业专题电子海图的数据结构。研究成果将有利于整合、共享与应用海洋渔业信息,促进渔业专题电子海图产品的研发与生产,为渔业生物资源研究与利用、渔业生产与管理以及海洋渔业经济发展等提供规范化信息服务支持。  相似文献   

16.
为科学制定加快大城市边缘区有序协调发展的途径和策略,提出了大城市边缘区地域特征属性的概念。从人口、用地、经济和社会等方面构建了地域特征属性界定的指标体系,利用模糊综合评价法构建了地域特征属性的界定模型。对北京城市边缘区内的小汤山镇、潭柘寺镇、温泉镇和万柳地区的地域特征属性进行了界定,结果表明:小汤山镇的地域特征属性值为0.4210,具有城市外边缘区的特征;潭柘寺镇的为0.0758。具有乡村腹地的特征;温泉镇为0.4922,具有城市内边缘区的特征;万柳地区为0.7116,具有城市内边缘区的特征。界定结果与实际情况相符。所提出的基于模糊综合评价的大城市边缘区地域特征属性的界定方法是可行、有效的。  相似文献   

17.
  目的  提出基于运动恢复结构的多株立木因子测量方法,以解决目前基于三维点云的立木因子测量方法获取立木树高和胸径存在效率低或成本高的问题。  方法  ①使用智能手机环绕包含多株立木的场景拍摄一段视频,并采用固定帧采样法和差异值哈希算法自动提取立木视频中的关键帧图像,然后,基于运动恢复结构(structure from motion,SfM)算法处理立木关键帧图像,从而获取立木场景的原始三维点云;②在对原始三维点云进行预处理及初步分割后,运用条件欧几里得聚类算法对多株立木三维点云进行分割,以提取单株立木三维点云;③对立木三维点云使用最值遍历法和椭圆拟合法实现立木树高和胸径的自动测量。  结果  与真实值相比,本研究方法测得的树高、胸径的平均相对误差分别为1.96%、3.19%,均方根误差分别为0.133 3 m、0.533 7 cm,相关系数分别为0.987 9、0.962 1。  结论  该方法具有较高的树高和胸径测量精度,提供了一种便捷、低成本的多株立木因子三维测量方法。图6表1参27  相似文献   

18.
Several typical supervised clustering methods such as Gaussian mixture model-based supervised clustering (GMM), k- nearest-neighbor (KNN), binary support vector machines (SVMs) and multiclass support vector machines (MC-SVMs) were employed to classify the computer simulation data and two real microarray expression datasets. False positive, false negative, true positive, true negative, clustering accuracy and Matthews' correlation coefficient (MCC) were compared among these methods. The results are as follows: (1) In classifying thousands of gene expression data, the performances of two GMM methods have the maximal clustering accuracy and the least overall FP+FN error numbers on the basis of the assumption that the whole set of microarray data are a finite mixture of multivariate Gaussian distributions. Furthermore, when the number of training sample is very small, the clustering accuracy of GMM-Ⅱ method has superiority over GMM- Ⅰ method. (2) In general, the superior classification performance of the MC-SVMs are more robust and more practical, which are less sensitive to the curse of dimensionality, and not only next to GMM method in clustering accuracy to thousands of gene expression data, but also more robust to a small number of high-dimensional gene expression samples than other techniques. (3) Of the MC-SVMs, OVO and DAGSVM perform better on the large sample sizes, whereas five MC-SVMs methods have very similar performance on moderate sample sizes. In other cases, OVR, WW and CS yield better results when sample sizes are small. So, it is recommended that at least two candidate methods, choosing on the basis of the real data features and experimental conditions, should be performed and compared to obtain better clustering result.  相似文献   

19.
邹永红  谭建林 《安徽农业科学》2011,39(25):15228-15229,15232
[目的]建立基于属性差异度的多属性决策方法并说明其在水稻优选中的应用。[方法]提出属性间贴近度的概念,在此基础上对属性间的差异度进行研究,并对基于属性差异度的权重确定方法进行分析。[结果]得到了1种基于属性差异度的多属性决策方法,并针对水稻优选问题说明了该方法具有应用及可行性。[结论]丰富了多属性决策中属性权重确定的问题,并为科学合理地选择水稻品种问题提供了必要的理论支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号