Pandas 是 Python 中一个强大的数据分析库,它提供了高效、灵活的数据结构,使得数据分析变得更加简单和便捷。以下是一些关于 Pandas 的基本概念和用法。

安装 Pandas

在开始之前,确保你已经安装了 Pandas。你可以使用以下命令进行安装:

pip install pandas

Pandas 的核心数据结构

Pandas 的核心数据结构是 DataFrame,它类似于一个表格,由行和列组成。DataFrame 可以用来存储和操作数据。

创建 DataFrame

import pandas as pd

data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)
print(df)

选择数据

你可以使用多种方式来选择 DataFrame 中的数据。

  • 使用列名:
print(df['Name'])
  • 使用列名列表:
print(df[['Name', 'Age']])
  • 使用条件:
print(df[df['Age'] > 20])

数据操作

Pandas 提供了丰富的数据操作功能,包括排序、过滤、分组等。

排序

df.sort_values(by='Age', ascending=False)

过滤

print(df[df['City'] == 'New York'])

分组

df.groupby('City').mean()

高级功能

Pandas 还提供了许多高级功能,例如:

  • 时间序列分析
  • 文本分析
  • 图形可视化

学习资源

更多关于 Pandas 的学习资源,请访问我们的 Pandas 教程

Pandas 图标