DBSCAN(Density-Based Spatial Clustering of Applications with Noise,噪声聚类)是一种基于密度的聚类算法,擅长发现任意形状的簇。以下是其核心要点:

✅ 核心原理

  • 密度可达性:通过邻域(ε-邻域)定义簇的密度,核心点需满足至少MinPts个点
  • 噪声处理:对孤立点或边界点进行标记,而非强行归属
  • 动态聚类:无需预设簇数量,适应复杂数据分布

📌 与其他算法对比

算法 优点 缺点
K-Means 计算效率高 对噪声敏感,需预设簇数
DBSCAN 自动确定簇数,抗噪声 对参数ε和MinPts敏感

🧩 应用场景

  • 异常检测(如欺诈交易识别)
  • 图像分割(如医学影像分析)
  • 空间数据挖掘(如地理围栏分析)
DBSCAN_工作原理

📘 扩展阅读

想深入了解密度聚类的其他变体?可参考密度聚类与层次聚类对比

📌 提示:尝试调整ε和MinPts参数,观察不同密度数据集的聚类效果差异!