Pandas 是 Python 中一个强大的数据分析库,它提供了数据结构 DataFrames 和丰富的数据分析工具。以下是一个简单的 Pandas 教程。

安装 Pandas

首先,确保你已经安装了 Python。然后,使用以下命令安装 Pandas:

pip install pandas

快速开始

数据结构

Pandas 提供了两种主要的数据结构:Series 和 DataFrame。

  • Series 是一个一维数组,类似于 Python 中的列表。
  • DataFrame 是一个二维表格,类似于 Excel 或 CSV 文件。

示例

import pandas as pd

# 创建一个 Series
data = pd.Series([1, 2, 3, 4, 5])

# 创建一个 DataFrame
data = {'Name': ['Tom', 'Nick', 'John', 'Alice'],
        'Age': [20, 21, 19, 18]}
df = pd.DataFrame(data)

print(df)

数据读取

Pandas 可以轻松地从各种文件格式中读取数据,例如 CSV、Excel、JSON 等。

df = pd.read_csv('data.csv')

数据操作

Pandas 提供了丰富的数据操作功能,例如筛选、排序、聚合等。

# 筛选
df_filtered = df[df['Age'] > 20]

# 排序
df_sorted = df.sort_values(by='Age', ascending=False)

# 聚合
df_grouped = df.groupby('Name').mean()

扩展阅读

想要了解更多关于 Pandas 的内容,可以访问我们的 Pandas 教程

图片

Pandas Logo