协同过滤(Collaborative Filtering)是一种基于用户行为数据的推荐算法,常用于个性化推荐场景。其核心思想是通过分析用户对物品的评分或交互记录,挖掘用户之间的偏好相似性,从而预测潜在兴趣。

基本概念

  • 用户-物品评分矩阵:记录用户对物品的评分或交互频率,是协同过滤的基础数据结构。
  • 相似度计算:常用余弦相似度(Cosine Similarity)或皮尔逊相关系数(Pearson Correlation)衡量用户或物品间的关联。
  • 预测机制:通过加权平均或矩阵分解等方法,预测未评分物品的偏好值。

常见类型

  1. 基于邻域的方法

    • 用户相似度:寻找与目标用户相似的其他用户,推荐其喜欢的物品
    • 物品相似度:寻找与目标物品相似的其他物品,推荐用户喜欢的关联物品
  2. 矩阵分解(Matrix Factorization)

    • 将用户-物品评分矩阵分解为低维隐向量,捕捉潜在特征
  3. 深度学习方法

    • 使用神经网络模型(如Wide & Deep、Graph Neural Networks)提升推荐效果

应用场景

  • 电商推荐:如商品购买/浏览行为分析
  • 视频平台:如用户观看历史驱动的视频推荐
  • 社交网络:如基于好友互动的动态内容推荐

优缺点

优点

  • 无需依赖物品属性,仅需用户行为数据
  • 适应性强,可挖掘长尾物品价值

缺点

  • 面临冷启动问题(新用户/新物品无历史数据)
  • 数据稀疏性可能导致预测偏差

扩展阅读

如需深入了解推荐系统的核心架构,可参考:
/zh/models/recommendation_system

用户物品评分矩阵
推荐系统流程图