无监督学习是机器学习的重要分支,其核心特点是无需标签数据,通过分析数据的内在结构发现隐藏模式。以下是关键知识点:
常见算法分类
🧠 聚类算法
- K-Means:将数据划分为K个簇,适合球形分布数据
- 🌳 层次聚类:构建数据的树状层次结构
- 🧭 DBSCAN:基于密度的聚类,能识别噪声点
📊 降维技术
- 📐 PCA(主成分分析):保留最大方差方向
- 📈 t-SNE:可视化高维数据的流形结构
应用场景
- 📖 数据分组(如客户细分)
- 📈 特征工程优化
- 🧩 异常检测(如信用卡欺诈识别)
扩展学习:有监督学习对比