K-Means聚类(K-Means Clustering)
定义
K-Means 是一种经典的基于质心的聚类算法,通过将数据划分为 个簇,最小化簇内数据点到簇质心的平方欧氏距离之和。K-Means 算法简单高效,广泛应用于数据挖掘、模式识别、图像分割等领域。
算法原理
目标函数
K-Means 的目标是最小化簇内误差平方和(SSE):
其中 为第 个簇的质心, 为第 个簇的数据点集合。
算法步骤
- 随机初始化 个质心
- 重复直至收敛:
- 分配步骤:将每个数据点分配到最近的质心
- 更新步骤:重新计算各簇质心为簇内数据点的均值
收敛性
K-Means 算法在有限迭代后必定收敛,但可能陷入局部最优。常用 -Means++ 初始化方法改善初始质心选择。
在地月空间SSA架构分析中的应用
Klonowski(2025)在分析地月空间 SSA 架构设计问题时,使用 K-Means 和 K-Medoids 聚类方法对帕累托最优架构进行分类:
特征提取
从架构配置中提取特征向量:
- 观测卫星数量
- 轨道族分布
- 覆盖性能指标
- 成本指标
聚类分析
- 对帕累托最优解集进行 K-Means 聚类
- 识别不同类型的架构配置
- 分析各簇的特点和适用场景
核心要素
数学定义
K-Means 将数据集 划分为 个不相交的簇 ,最小化 SSE 目标函数。
关键性质
K-Means 的时间复杂度为 ,其中 为迭代次数, 为数据点数, 为簇数, 为维度。算法假设簇为球形、球形大小相近。
与 K-Medoids 对比
| 特性 | K-Means | K-Medoids |
|---|---|---|
| 质心类型 | 簇内均值(可为非数据点) | 簇内实际数据点 |
| 对噪声鲁棒性 | 低 | 高 |
| 计算复杂度 | 低 | 较高 |
相关概念
参考文献
- MacQueen J. Some methods for classification and analysis of multivariate observations[C]. Berkeley Symposium on Mathematical Statistics and Probability, 1967.
- Klonowski M, Owens-Fahrner N, Heidrich C, et al. Cislunar space domain awareness architecture design and analysis for cooperative agents[J]. The Journal of the Astronautical Sciences, 2024.
