K-Means 算法是一种简单的聚类算法,它将数据点划分为 K 个簇,使得每个数据点都属于最近的簇中心(也称为均值)。

K-Means 算法步骤

  1. 选择 K 个数据点作为初始聚类中心
  2. 对于每个数据点,计算其与每个聚类中心的距离
  3. 将每个数据点分配给最近的聚类中心
  4. 更新每个聚类中心的坐标为它所包含的所有点的均值
  5. 重复步骤 2 到 4,直到聚类中心不再移动或者达到预定的迭代次数

代码示例

以下是一个简单的 K-Means 算法 Python 代码示例:

from sklearn.cluster import KMeans
import numpy as np

# 创建一些数据
data = np.array([[1, 2], [1, 4], [1, 0],
                  [10, 2], [10, 4], [10, 0]])

# 创建 KMeans 对象
kmeans = KMeans(n_clusters=2)

# 拟合数据
kmeans.fit(data)

# 打印聚类结果
print(kmeans.labels_)

扩展阅读

想了解更多关于 K-Means 算法的知识?请访问我们的 机器学习教程 页面。

图片展示

K-Means 算法流程图

K-Means 算法流程图