📊 本数据集源自 1912 年泰坦尼克号沉船事故的乘客记录,是机器学习领域经典的教学案例。以下是核心信息概览:
📋 数据字段说明
- PassengerId:乘客唯一标识符
- Survived:是否幸存(0 = 死亡,1 = 生存)
- Pclass:船舱等级(1/2/3 等)
- Name:乘客姓名
- Sex:性别(男性/女性)
- Age:年龄(部分缺失)
- SibSp:同船兄弟姐妹/配偶数量
- Parch:同船父母子女数量
- Ticket:船票编号
- Fare:票价(部分缺失)
- Cabin:客舱编号(部分缺失)
- Embarked:登船港口(Southampton, Cherbourg, Queenstown)
📊 数据规模
- 总记录数:1309 条
- 特征数量:12 个字段
- 缺失值处理:Age、Cabin、Embarked 等字段包含缺失值,适合练习数据清洗技能