基于K均值算法增强初始中心的研究 |
| |
作者单位: | ;1.海军工程大学电子工程学院 |
| |
摘 要: | 随着数据库技术以及数据库管理系统的迅速发展,人们积累的数据越来越多。聚类(clustering)作为数据挖掘三大领域(关联规则,聚类,分类)之一被广泛应用[1]。K-均值算法属于聚类中最普遍快速方法,常采用误差平方和准则函数作为聚类准则。但K均值算法不能保证标准的全局最小值,这导致对初始质心的高敏感度。本文提出通过消除初始质心的随机选择来提高算法性能。本文提出增强的初始质心的K均值算法,由于对应用数据集进行加权平均,消除了初始值的随机选择,减少了迭代步数,降低了计算复杂度。
|
关 键 词: | 聚类 K均值 误差平方和准则 |
|
|