首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对信息挖掘中的文本自动聚类问题,提出了一种基于模糊向量空间模型的核聚类算法。首先对聚类文本进行模糊特征提取得到模糊特征项集,然后依据模糊特征项集对每篇文本计算特征项的文档频数,进而得出每篇文本的模糊特征向量。最后利用高斯核函数将每篇文本的特征向量映射到高维特征空间,在高维特征空间中利用核聚类算法实施文本聚类。该方法在特征提取时充分考虑了特征项在文档中的位置信息,使自动聚类原则更接近手工聚类方法。以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。  相似文献   

2.
模糊聚类分析已被广泛应用在气象预报、地质、模式识别、数据挖掘等方面。文章将模糊聚类分析应用于作物核心种质构建过程中,并对传统的模糊聚类算法进行了改进,在相似系数和距离系数的基础上,提出了一种既能考虑到样本之间的值贴近程度,又能考虑到样本之间的形贴近程度的改进系数——相似度,用相似度矩阵替代传统的相似矩阵,使模糊聚类分析模型能够更符合构建作物核心种质的需要。  相似文献   

3.
一种改进的K-均值聚类算法的研究   总被引:1,自引:0,他引:1  
聚类分析在科研和商业应用中都有着非常重要的作用。K-均值聚类算法是一种基于样本间相似性度量的间接聚类方法,其不足之处是,它采用均值作为一类的代表点,一个点往往不能充分反映该类的模式分布结构,从而损失了很多有用的信息。研究了一种改进的K-均值聚类算法,在求样本间距离时,采用核函数距离代替欧氏距离,考虑了各模式间的相关性。试验结果表明,利用改进的K-均值聚类算法,聚类结果的准确率更高,更稳定。  相似文献   

4.
聚类分析在科研和商业应用中都有着非常重要的作用。K-均值聚类算法是一种基于样本间相似性度量的间接聚类方法,其不足之处是,它采用均值作为一类的代表点,一个点往往不能充分反映该类的模式分布结构,从而损失了很多有用的信息。研究了一种改进的 K-均值聚类算法,在求样本间距离时,采用核函数距离代替欧氏距离,考虑了各模式间的相关性。试验结果表明,利用改进的 K-均值聚类算法,聚类结果的准确率更高,更稳定。  相似文献   

5.
蚁群优化算法(ACO)在求解TSP(traveling salesman problem)问题时,其算法的时间复杂度为O(m·n2·t)(其中t表示循环次数,n为城市数,m为蚂蚁数),搜索时间比较长。利用K-means聚类的方法得到多个类,每一个类都看作是一个小的TSP问题,然后在每个类内部和类之间利用改进的蚁群算法寻找最优路径,通过实验仿真,验证了此方法不但能提高解的精度,而且还加快了运行速度。  相似文献   

6.
模糊聚类计算方法的理论分析   总被引:21,自引:0,他引:21  
分析了聚类分析4种原始数据规格化处理的数据特征,提出最大值规格化与均值规格化,由于能保持不同指标的原分辨力,是较好的方法。将常用的相似性度量方法分为绝对差数、相对差数、比例相似性3种类型。论证了基于模糊等价关系的模糊聚类法就是经典系统聚类的最短距离法,模糊系统聚类仅是一般系统聚类法的特例。  相似文献   

7.
模糊聚类计算方法的理论分析   总被引:5,自引:0,他引:5  
分析了聚类分析4种原始数据规格化处理的数据特征,提出最大值规格化与均值规格化,由于能保持不同指标的原分辨力,是较好的方法。将常用的相似性度量方法分为绝对差数、相对差数、比例相似性3种类型。论证了基于模糊等价关系的模糊聚类法就是经典系统聚类的最短距离法,模糊系统聚类仅是一般系统聚类法的特例。  相似文献   

8.
K均值聚类算法是聚类方法中使用相对广泛的一种算法。K均值聚类算法将K作为人工事先设定的一个聚类参数,也就是目标把N个样本对象数据划分为K个簇类,使每个簇内样本对象都具有相对较高的相似度。然而在使用k均值聚类算法的时候,预先要确定想要聚类的类别数k,但是有时有又无法得到最合适的聚类数k,也就加大了人工计算量。  相似文献   

9.
针对数量大、数据结构复杂、离散度大的样本数据的聚类分析,采用ISODATA算法实现.ISODATA算法是1种基于统计模式识别的非监督学习动态聚类方法,是大样本数据聚类分析常用的方法,但该算法需要预先确定初始聚类参数.本文提出了基于黄金分割法来度量聚类的有效性,该方法能动态计算聚类度量参数,以此实现大样本数据的有效聚类.实验证明:该方法能够合理、有效的进行数据聚类.  相似文献   

10.
本文对有人采用的模糊聚类的一种算法给出了一个反例。并说明这种方法的采用是有条件的。  相似文献   

11.
大米中矿物元素种类多(38种),为了快速、准确地筛选出判别大米产地的有效指标,在分析大米矿物元素含量相关性的基础上,进行了大米产地判别分类算法对比实验。首先通过R型聚类方法将大米矿物元素样本进行分块,然后从每一类中选取数据再进行Fisher与KNN判别分类对比,这样可以改进传统算法中剪辑样本带来的判别误差,又大大降低了无效的计算量。实验表明,基于聚类选出一种元素最优组合方案,采用23种矿物元素进行Fisher判别的分类率达86.76%,此方法准确高效地降低了计算机的运算量,提高了判别分类速度。  相似文献   

12.
UK均值算法需要计算每个对象之间的期望距离(EDS)和聚类中心, EDS计算的成本就成了UK均值计算的性能瓶颈。为了提高UK均值的计算效率,本文提出一种优化的UK均值算法,通过一个高效的公式来估计期望距离,大大降低了UK均值的额外时间,并在实验中得以证明。我们还说明这个优化公式有效地将UK均值算法降低到了传统的基于K均值的聚类算法。  相似文献   

13.
为提高K-均值聚类算法在医学CT图像分割上的应用效果、稳定性和质量,减少程序运行时间,本研究用Matlab语言优化了K-均值聚类算法程序,与StatisticsToolbox的K—means函数进行比较,使用单因素方差分析法检验两种算法实现程序运行时间的差异,并直接观察分割效果和稳定性。结果显示,改进后的K-均值聚类算法程序具有分割结果稳定、质量提高等优点,在常用Windows操作系统和Pc机配置环境下,分割耗时在1s左右,显著低于原有的分割程序,消除了等待感觉,提高了使用者的工作舒适度和效率,为图像的识别处理奠定了基础。  相似文献   

14.
研究现有的迭代优化聚类的初始化方法:即采样法,距离优化法以及密度估计法,分析它们的优缺点.提出一种新的基于距离的初始化方法,它不需要设定门限,不受数据集的顺序影响,它使得聚类过程有良好的速度和迭代次数,且初始化运算时间较短,对孤立点和噪声有较强的抑制作用,它适用于较大规模数据的聚类初始化.  相似文献   

15.
结合图书管理参数复杂,变量维数较高,多属性数据点集中不但包含数值型属性,还有类别属性和混合型属性的特点,将模糊聚类算法与属性加权优化相结合,进而推导出优化迭代公式并形成加权聚类算法对图书数据管理中的相关影响因素进行聚类分析,得到了相关具有较大影响因素的相关变量,对于企业今后一段时间内的精细化管理给出了控制方向和指标.  相似文献   

16.
本体构造就是利用各种数据源以半自动方式新建或扩充改编已有本体以构建一个新本体。现有的本体构造方法大都以大量领域文本和背景语料库为基础抽取大量概念术语,然后从中选出领域概念构造出一个本体。Cluster-Merge算法首先对领域文档先用k-means聚类算法进行聚类,然后根据文档聚类的结果来构造本体,最后根据本体相似度进行本体合并得到最终的输出本体。通过实验可证明用Cluster-Merge算法得出的本体可以提高查全率、查准率。  相似文献   

17.
改进的基于模糊C-均值聚类的图像分割算法   总被引:1,自引:0,他引:1  
为了提高图像分割算法的抗噪声性能,提出了一种改进的基于模糊C-均值聚类的图像分割算法.该算法首先根据邻域像素的隶属度矩阵来计算出像素和聚类中心的空间距离,然后利用空间距离和欧氏距离来重新确定像素和聚类中心的距离,最后利用新提取的距离特征和改进的FCM聚类算法对图像进行分割.实验结果表明,该算法能有效地提取目标图像,对噪声具有较强的鲁棒性,收敛速度快.
Abstract:
To enhance the noise immunity performance of the image segmentation algorithm, an improved algorithm for image segmentation based on fuzzy C-means clustering is proposed in this paper. The spatial distance between a pixel and the cluster center is calculated by the membership matrix of the neighboring pixels, and a new distance is determined by the spatial distance and the Euclidean distance. This new distance feature and the improved algorithm based on fuzzy C-means clustering are used in image segmentation. The experimental results show that the proposed algorithm is effective in getting the target image,more robust to the noises and faster than the conventional fuzzy C-means (FCM) algorithm.  相似文献   

18.
针对传统聚类算法在图像分割中对聚类中心选择敏感,可靠性差的缺点,本文采用AP聚类算法研究图像分割问题。AP(Affinity propagation)聚类算法是通过数据点之间的信息传递产生高质量的聚类中心,避免了聚类初始中心选择难的问题。本文通过与K均值算法和模糊C均值算法在图像分割中的实验比较,得出本算法优于其他两种算法,对图像可取得良好的分割效果。  相似文献   

19.
鄢陵素心腊梅类品种的模糊聚类研究   总被引:5,自引:0,他引:5  
  相似文献   

20.
基于二叉树结构聚类算法的彩色图像分割研究   总被引:1,自引:0,他引:1  
提出了一种基于二叉树结构的彩色图像分割方法,首先对待分割图像采用最优阈值化方法获取R,G,B 3个颜色空间的最佳阈值,然后通过构造自适用二叉树进行一次粗分割提取目标区域,最后采用C-均值聚类算法对二叉树的每个叶子节点进行精确分割.试验表明,该算法可以在保留原图像中大部分的信息的基础上,对目标物体进行有效的分割.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号