MovieLens 是一个广泛使用的 推荐系统 研究数据集,包含用户对电影的评分、标签和观影记录。以下是其核心内容与使用指南:

📚 数据集特点

  • 评分数据:用户对电影的打分(1-5星),用于训练协同过滤模型
  • 标签数据:用户对电影的文本标签,支持内容推荐研究
  • 用户行为:包含点击、收藏、评分等多维度交互数据
  • 时间戳:记录用户操作的时间,便于分析行为序列

📌 数据集结构

  1. 用户文件users.csv(用户ID、性别、出生日期等)
  2. 电影文件movies.csv(电影ID、标题、类型等)
  3. 评分文件ratings.csv(用户ID、电影ID、评分、时间戳)
  4. 标签文件tags.csv(用户ID、电影ID、标签、时间戳)
MovieLens_数据集结构

🧠 典型应用场景

  • 协同过滤:基于用户评分预测未观看电影的喜好
  • 深度学习:训练神经网络模型进行推荐
  • 可视化分析:探索评分分布与用户画像
评分分布

📦 获取方式

  1. 访问 MovieLens官网 下载最新版本
  2. 或通过 本站数据集页面 获取预处理后的版本
数据集_下载链接

如需了解推荐系统相关算法,可访问 推荐系统专题 深入学习 😊