数据转换是数据分析流程中的关键步骤,以下是常用方法与示例:

常用转换操作 ✅

  • 排序:使用 df.sort_values() 对数据框进行排序
    排序操作
  • 缺失值处理:通过 df.fillna() 填充或删除缺失数据
    缺失值填充
  • 数据类型转换:用 df.astype() 修改列的数据类型
  • 分组聚合:借助 df.groupby() 进行分组分析
    分组聚合

示例代码 🧾

import pandas as pd

# 创建示例数据
data = {'Name': ['张三', '李四', '王五'], 'Score': [85, 92, 78]}
df = pd.DataFrame(data)

# 数据转换示例
df['Score'] = df['Score'].astype('category')  # 类型转换
df_sorted = df.sort_values('Score', ascending=False)  # 排序
df_filled = df.fillna({'Score': 0})  # 缺失值填充

应用场景 🌐

  • 特征工程:标准化/归一化数值特征
  • 数据清洗:统一日期格式、转换字符串为数值
  • 数据重塑:使用 pivot()melt() 重新组织数据结构

如需深入学习数据清洗技巧,可访问:/[Pandas_Data_Cleaning]
注:本链接为站内路径,包含英文内容以供扩展阅读

📌 提示:转换操作前建议先使用 df.head() 查看数据样例,避免误操作!