共查询到20条相似文献,搜索用时 15 毫秒
1.
针对信息挖掘中的文本自动聚类问题,提出了一种基于模糊向量空间模型的核聚类算法。首先对聚类文本进行模糊特征提取得到模糊特征项集,然后依据模糊特征项集对每篇文本计算特征项的文档频数,进而得出每篇文本的模糊特征向量。最后利用高斯核函数将每篇文本的特征向量映射到高维特征空间,在高维特征空间中利用核聚类算法实施文本聚类。该方法在特征提取时充分考虑了特征项在文档中的位置信息,使自动聚类原则更接近手工聚类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。 相似文献
2.
现代信息社会中,许多实际问题都归结为复杂网络中模块问题的研究,而聚类方法是研究复杂网络中模块性的重要方法。本研究将基于视觉原理的密度聚类算法与传统的K均值聚类算法相结合,提出了一种新的聚类算法,即密度K均值聚类算法。该算法在一定程度上克服了传统的K均值聚类算法易受异常点影响和无法确定聚类数的问题,具有对初始参数不敏感、可发现任意形状的聚类,以及能找到最优聚类等优点。基于此,以城市建通网络中交巡警指挥平台的设置问题为例,通过Matlab程序求解说明了所给出聚类算法的应用。 相似文献
3.
加权空间模糊动态聚类算法在土壤肥力评价中的应用 总被引:7,自引:0,他引:7
【目的】改进和提高空间模糊聚类算法。【方法】首先利用层次分析法得到各属性的权值,然后将权值与空间模糊动态聚类法相结合,最后利用概率统计中的F分布来确定最佳分类,以提高空间模糊聚类算法的智能性。【结果】加权空间模糊动态聚类算法与基于模糊等价关系的传递闭包方法进行比较表明,当λ取0.993时,F值最大,分类效果最好。此时,加权的F值为4.898,未加权的F值为2.957,说明加权的类间的差距比未加权的明显,即该算法聚类准确率要明显高于未加权的模糊聚类算法。【结论】将其改进的算法运用到精准农业的土壤肥力评价中,试验结果与实际情况相符,证明了该算法的有效性。 相似文献
4.
以"竹藤种质资源数据库"中126个竹种为基础数据,应用K均值聚类算法(K-means算法)、小批量K均值聚类算法(Mini Batch K means算法)、凝聚层次聚类算法,依据竹种酸不溶木质素、苯醇提取物、综纤维素、基本密度、纤维长度、纤维双壁厚、纤维壁腔比7个特征对竹种筛选分级,遴选优良造纸竹种,分析聚类算法对竹藤种质资源的聚类有效性.结果表明:K均值聚类算法具有最高的卡林斯其-哈瑞本斯(Calinski_Harabaz(CH))指标值(63.568),聚类效果最好,126个竹种分为3级.其中:Ⅰ级造纸竹种,包含糯竹、空竹等51个竹种,适合制作高级纸张;Ⅱ级造纸竹种,包括毛竹、思劳竹等62个竹种,适合在排污能力强的造纸厂做纸浆造纸原料.K均值聚类算法是竹种造纸适应性分析的高效可靠的方法,具有较好的应用前景. 相似文献
5.
K均值聚类算法是聚类方法中使用相对广泛的一种算法。K均值聚类算法将K作为人工事先设定的一个聚类参数,也就是目标把N个样本对象数据划分为K个簇类,使每个簇内样本对象都具有相对较高的相似度。然而在使用k均值聚类算法的时候,预先要确定想要聚类的类别数k,但是有时有又无法得到最合适的聚类数k,也就加大了人工计算量。 相似文献
6.
聚类算法在玉米叶片病斑降维识别中的应用 总被引:1,自引:0,他引:1
为了及时、准确地识别玉米病害,基于聚类识别算法,进行了玉米叶片病斑图像识别的对比试验。首先利用LLE算法对玉米图像降维以提取特征,然后采用K-均值算法、FCM算法和GK算法进行聚类分析,其中GK算法能够有效识别出玉米病斑图像,正确识别率高达95.5%。可见,GK模糊聚类算法对玉米病斑图像的识别效果较好。 相似文献
7.
8.
针对当前基本农田划定过程中主观干预过多的问题,在综合考虑耕地质量情况、交通区位条件和耕地连片性等因素的基础上,提出一种基于网格的基本农田保护规划空间聚类算法。该算法以网格作为分析单元,首先以K-Means算法对网格的属性进行初步聚类;然后利用网格间的空间关系和相似性进行最大相似区的确定;最后再以模糊聚类方法对细碎区聚合归并,最终得到基本农田保护区域,可用于指导基本农田保护规划的实施。并通过具体案例分析证明了该算法的可行性和实用性,且具有较高的计算效率。 相似文献
9.
压缩根瘤菌分类属性空间的聚类方法研究 总被引:3,自引:0,他引:3
用系统聚类方法(R技术),分析了性状对偶间的相似性,并结合比较检测方法的特异性、稳定性、安全性和材料来源的难易等因素,把253株根瘤菌的248维分类属性空间压缩到130。经两组抽样验证,聚类分析结果基本保持了原分类体系的主体结构。可以认为,选定的性状能够满足目前根瘤菌数值分类的要求。这不仅减少了今后要瘤菌数值分类的工作量,还有助于为根瘤菌分类、鉴定特征的标准化建立基础。 相似文献
10.
11.
针对传统聚类算法在图像分割中对聚类中心选择敏感,可靠性差的缺点,本文采用AP聚类算法研究图像分割问题。AP(Affinity propagation)聚类算法是通过数据点之间的信息传递产生高质量的聚类中心,避免了聚类初始中心选择难的问题。本文通过与K均值算法和模糊C均值算法在图像分割中的实验比较,得出本算法优于其他两种算法,对图像可取得良好的分割效果。 相似文献
12.
陈亚新 《内蒙古农业大学学报(自然科学版)》1991,(1)
本文用模糊集方法研究了灌溉工程—渠床土壤透水性的聚类及其空间分布(相似性)特征,有助于增加传统土壤与地质剖面制图描述的定量成分及对该系统结构规律(连续性)的揭露。也从另一角度对土壤空间变异性作了一种新的补充。为渠道理论输水损失水量计算提供了土壤透水性单元聚类图、模式样本及入渗总水量的模式样本的数学模型。 相似文献
13.
蚁群优化算法(ACO)在求解TSP(traveling salesman problem)问题时,其算法的时间复杂度为O(m·n2·t)(其中t表示循环次数,n为城市数,m为蚂蚁数),搜索时间比较长。利用K-means聚类的方法得到多个类,每一个类都看作是一个小的TSP问题,然后在每个类内部和类之间利用改进的蚁群算法寻找最优路径,通过实验仿真,验证了此方法不但能提高解的精度,而且还加快了运行速度。 相似文献
14.
15.
16.
用系统聚类方法(R 技术),分析了性状对偶间的相似性,并结合比较检测方法的特异性、稳定性、安全性和材料来源的难易等因素,把253株根瘤菌的248维分类属性空间压缩到130。经两组抽样验证。聚类分析结果基本保持了原分类体系的主体结构。可以认为,选定的性状能够满足目前根瘤菌数值分类的要求。这不仅减少了今后根瘤菌数值分类的工作量,还有助于为根瘤菌分类、鉴定特征的标准化建立基础。 相似文献
17.
灰色聚类法在湿地水体富营养化评价中的应用 总被引:14,自引:0,他引:14
将灰色聚类法应用到湿地水体富营养化评价中,旨在建立起一套比较完善、适合于湿地水体富营养化的评价体系。把湿地水体富营养化程度划分为6个级别,其阚值参照中国湖泊富营养化评价标准和湿地富营养化的特点。利用灰类白化权函数描述水体富营养化分级界限,正确地选择了各参评指标对于各等级的聚类权,在此基础上构建了湿地水体富营养化灰色聚类法综合评判模型。并以扎龙湿地为例进行了实例计算与分析,验证了此模型的准确性、可比性和实用性。 相似文献
18.
19.
张亚昕 《湖南农业大学学报(自然科学版)》2013,(2):60-63
UK均值算法需要计算每个对象之间的期望距离(EDS)和聚类中心, EDS计算的成本就成了UK均值计算的性能瓶颈。为了提高UK均值的计算效率,本文提出一种优化的UK均值算法,通过一个高效的公式来估计期望距离,大大降低了UK均值的额外时间,并在实验中得以证明。我们还说明这个优化公式有效地将UK均值算法降低到了传统的基于K均值的聚类算法。 相似文献
20.
灰色聚类法在升钟水库水体富营养化评价中的应用 总被引:10,自引:1,他引:10
水库水环境是一个灰色系统.将灰色聚类法应用到水库富营养评价中,是为了建立一种比较完善,适合于水库富营养化评价的模型,从而合理地评价库区的水质,为水库的管理提供依据.参照中国湖泊水库富营养化评价标准和水库的富营养化特点,选取评价指标.将富营养化程度分为6个级别,利用灰类白化权函数描述水体富营养化的等级界线,确定各指标在灰类中的聚类权以及聚类系数,确定各聚类对象的等级,在此基础卜建立水库富营养化综合评价模型.以四川的升钟水库为研究对象,采用该水库具代表性监测点2006年的监测数据进行分析.结果表明,升钟水库的监测点中铁鞭电站、果园场、大石桥富营养化程度较重,铁路寺、青岗垭次之,李家坝最轻;该水库富营养化与周边的不合理开发密切相关,尤其是面源污染负荷的加重和网箱养鱼的增加,进一步加重了库区的水体富营养化.因此灰色聚类应用于环境质量评价中是可行的,关键是正确划分灰类白化函数. 相似文献