泰坦尼克号乘客数据集概览
本页展示了泰坦尼克号乘客数据集的概览,这是一个著名的机器学习数据集,常用于数据分析和机器学习模型训练。
数据集特点
- 来源:泰坦尼克号沉船事件
- 数据量:共712个乘客记录
- 变量:包括乘客的年龄、性别、舱位等级、票价等信息
数据集用途
该数据集被广泛用于以下用途:
- 机器学习:用于构建预测模型,例如预测乘客是否幸存
- 数据可视化:展示数据分布和趋势
- 数据清洗:学习如何处理缺失值和不一致的数据
数据结构
以下是一个示例数据行:
- PassengerId:乘客ID
- Survived:是否幸存(1代表幸存,0代表未幸存)
- Name:乘客姓名
- Pclass:舱位等级(1代表头等舱,2代表二等舱,3代表三等舱)
- Sex:性别
- Age:年龄
- SibSp:同船兄弟姐妹或配偶的数量
- Parch:同船父母或孩子的数量
- Ticket:船票号码
- Fare:票价
- Cabin:舱位号
- Embarked:登船港口(C代表南安普顿,Q代表皇后镇,S代表悉尼)
相关链接
想要了解更多关于泰坦尼克号乘客数据集的信息,请访问数据集详情。
图片展示
泰坦尼克号