协同过滤(Collaborative Filtering)是一种基于用户行为数据的推荐算法,常用于个性化推荐场景。其核心思想是通过分析用户对物品的评分或交互记录,挖掘用户之间的偏好相似性,从而预测潜在兴趣。
基本概念
- 用户-物品评分矩阵:记录用户对物品的评分或交互频率,是协同过滤的基础数据结构。
- 相似度计算:常用余弦相似度(Cosine Similarity)或皮尔逊相关系数(Pearson Correlation)衡量用户或物品间的关联。
- 预测机制:通过加权平均或矩阵分解等方法,预测未评分物品的偏好值。
常见类型
基于邻域的方法
- 用户相似度:寻找与目标用户相似的其他用户,推荐其喜欢的物品
- 物品相似度:寻找与目标物品相似的其他物品,推荐用户喜欢的关联物品
矩阵分解(Matrix Factorization)
- 将用户-物品评分矩阵分解为低维隐向量,捕捉潜在特征
深度学习方法
- 使用神经网络模型(如Wide & Deep、Graph Neural Networks)提升推荐效果
应用场景
- 电商推荐:如商品购买/浏览行为分析
- 视频平台:如用户观看历史驱动的视频推荐
- 社交网络:如基于好友互动的动态内容推荐
优缺点
✅ 优点:
- 无需依赖物品属性,仅需用户行为数据
- 适应性强,可挖掘长尾物品价值
❌ 缺点:
- 面临冷启动问题(新用户/新物品无历史数据)
- 数据稀疏性可能导致预测偏差
扩展阅读
如需深入了解推荐系统的核心架构,可参考:
/zh/models/recommendation_system