📊 本数据集源自 1912 年泰坦尼克号沉船事故的乘客记录,是机器学习领域经典的教学案例。以下是核心信息概览:

📋 数据字段说明

  • PassengerId:乘客唯一标识符
  • Survived:是否幸存(0 = 死亡,1 = 生存)
  • Pclass:船舱等级(1/2/3 等)
  • Name:乘客姓名
  • Sex:性别(男性/女性)
  • Age:年龄(部分缺失)
  • SibSp:同船兄弟姐妹/配偶数量
  • Parch:同船父母子女数量
  • Ticket:船票编号
  • Fare:票价(部分缺失)
  • Cabin:客舱编号(部分缺失)
  • Embarked:登船港口(Southampton, Cherbourg, Queenstown)

📊 数据规模

  • 总记录数:1309 条
  • 特征数量:12 个字段
  • 缺失值处理:Age、Cabin、Embarked 等字段包含缺失值,适合练习数据清洗技能

🔗 了解更多数据可视化分析

titanic_dataset