K-Means 算法是一种简单的聚类算法,它将数据点划分为 K 个簇,使得每个数据点都属于最近的簇中心(也称为均值)。
K-Means 算法步骤
- 选择 K 个数据点作为初始聚类中心。
- 对于每个数据点,计算其与每个聚类中心的距离。
- 将每个数据点分配给最近的聚类中心。
- 更新每个聚类中心的坐标为它所包含的所有点的均值。
- 重复步骤 2 到 4,直到聚类中心不再移动或者达到预定的迭代次数。
代码示例
以下是一个简单的 K-Means 算法 Python 代码示例:
from sklearn.cluster import KMeans
import numpy as np
# 创建一些数据
data = np.array([[1, 2], [1, 4], [1, 0],
[10, 2], [10, 4], [10, 0]])
# 创建 KMeans 对象
kmeans = KMeans(n_clusters=2)
# 拟合数据
kmeans.fit(data)
# 打印聚类结果
print(kmeans.labels_)
扩展阅读
想了解更多关于 K-Means 算法的知识?请访问我们的 机器学习教程 页面。