泰坦尼克号乘客数据集概览

本页展示了泰坦尼克号乘客数据集的概览,这是一个著名的机器学习数据集,常用于数据分析和机器学习模型训练。

数据集特点

  • 来源:泰坦尼克号沉船事件
  • 数据量:共712个乘客记录
  • 变量:包括乘客的年龄、性别、舱位等级、票价等信息

数据集用途

该数据集被广泛用于以下用途:

  • 机器学习:用于构建预测模型,例如预测乘客是否幸存
  • 数据可视化:展示数据分布和趋势
  • 数据清洗:学习如何处理缺失值和不一致的数据

数据结构

以下是一个示例数据行:

  • PassengerId:乘客ID
  • Survived:是否幸存(1代表幸存,0代表未幸存)
  • Name:乘客姓名
  • Pclass:舱位等级(1代表头等舱,2代表二等舱,3代表三等舱)
  • Sex:性别
  • Age:年龄
  • SibSp:同船兄弟姐妹或配偶的数量
  • Parch:同船父母或孩子的数量
  • Ticket:船票号码
  • Fare:票价
  • Cabin:舱位号
  • Embarked:登船港口(C代表南安普顿,Q代表皇后镇,S代表悉尼)

相关链接

想要了解更多关于泰坦尼克号乘客数据集的信息,请访问数据集详情

图片展示

泰坦尼克号