Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活且易于使用的数据结构,用于数据分析。以下是一些 Pandas 的基本教程。

安装 Pandas

pip install pandas

快速开始

1. 创建 DataFrame

DataFrame 是 Pandas 的核心数据结构,类似于 R 中的数据框或 SQL 中的表。

import pandas as pd

data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)
print(df)

2. 选择数据

你可以使用 .loc.iloc 来选择 DataFrame 中的数据。

# 使用标签选择
print(df.loc[df['Name'] == 'Tom'])

# 使用整数索引选择
print(df.iloc[1:3])

3. 数据操作

Pandas 提供了丰富的数据操作功能,如排序、过滤、聚合等。

# 排序
print(df.sort_values(by='Age'))

# 过滤
print(df[df['City'] == 'London'])

# 聚合
print(df.groupby('City').mean())

扩展阅读

更多 Pandas 教程,请访问我们的 Pandas 教程页面

图片

Pandas Logo