Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活且富有表达力的数据结构,可以用于数据清洗、转换和分析。以下是一些 Pandas 教程的基础内容,帮助您开始学习 Pandas。

快速入门

安装 Pandas

pip install pandas

导入 Pandas

import pandas as pd

创建 DataFrame

data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)

基本操作

选择数据

# 选择所有 Name 列的值
df['Name']

# 选择行
df.loc[1:2]

# 选择列
df[['Name', 'Age']]

数据清洗

  • 删除重复数据
df.drop_duplicates()
  • 删除缺失值
df.dropna()

数据转换

  • 改变数据类型
df['Age'] = df['Age'].astype(int)

高级功能

合并数据

  • 合并两个 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E'], 'value': [5, 6, 7]})
result = pd.merge(df1, df2, on='key')

数据分组

df.groupby('Name')['Age'].sum()

数据透视表

df.pivot_table(values='Age', index='Name', columns='Gender', aggfunc='mean')

实用技巧

  • 使用 .head() 查看前几行数据
  • 使用 .tail() 查看最后几行数据
  • 使用 .info() 查看数据概览

扩展阅读

想了解更多 Pandas 高级技巧?请访问我们的 Pandas 高级教程

Pandas Logo