数据转换是数据分析流程中的关键步骤,以下是常用方法与示例:
常用转换操作 ✅
- 排序:使用
df.sort_values()
对数据框进行排序 - 缺失值处理:通过
df.fillna()
填充或删除缺失数据 - 数据类型转换:用
df.astype()
修改列的数据类型 - 分组聚合:借助
df.groupby()
进行分组分析
示例代码 🧾
import pandas as pd
# 创建示例数据
data = {'Name': ['张三', '李四', '王五'], 'Score': [85, 92, 78]}
df = pd.DataFrame(data)
# 数据转换示例
df['Score'] = df['Score'].astype('category') # 类型转换
df_sorted = df.sort_values('Score', ascending=False) # 排序
df_filled = df.fillna({'Score': 0}) # 缺失值填充
应用场景 🌐
- 特征工程:标准化/归一化数值特征
- 数据清洗:统一日期格式、转换字符串为数值
- 数据重塑:使用
pivot()
或melt()
重新组织数据结构
如需深入学习数据清洗技巧,可访问:/[Pandas_Data_Cleaning]
(注:本链接为站内路径,包含英文内容以供扩展阅读)
📌 提示:转换操作前建议先使用
df.head()
查看数据样例,避免误操作!