Pandas 是一个强大的数据分析工具,它可以帮助你轻松地处理和分析数据。以下是 Pandas 的基本教程,帮助你快速上手。

安装 Pandas

首先,你需要安装 Pandas 库。可以通过以下命令进行安装:

pip install pandas

导入 Pandas

在 Python 中,你需要导入 Pandas 库才能使用它的功能。

import pandas as pd

创建 DataFrame

DataFrame 是 Pandas 的核心数据结构,类似于表格。

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

显示 DataFrame

你可以使用 print() 函数来显示 DataFrame。

print(df)

展示结果

Name Age City
Alice 25 New York
Bob 30 Los Angeles
Charlie 35 Chicago

数据操作

Pandas 提供了丰富的数据操作功能,包括选择、筛选和排序等。

选择列

name_col = df['Name']
print(name_col)

筛选行

age_over_30 = df[df['Age'] > 30]
print(age_over_30)

高级功能

Pandas 还提供了高级功能,如合并、重塑和分组等。

合并数据

df2 = pd.DataFrame({
    'Name': ['Dave', 'Eve'],
    'Age': [40, 45],
    'City': ['Houston', 'Phoenix']
})

df = pd.concat([df, df2])
print(df)

重塑数据

df_melted = df.melt(id_vars=['Name'], value_vars=['Age', 'City'])
print(df_melted)

分组

grouped = df.groupby('City')
print(grouped.mean())

学习更多

想要了解更多关于 Pandas 的知识,请访问我们的官方文档:Pandas 官方文档

Pandas Logo