Pandas 是一个强大的数据分析工具,在 Python 中非常流行。以下是一些 Pandas 的基本概念和操作。

安装 Pandas

在开始之前,请确保您已经安装了 Pandas。您可以使用以下命令进行安装:

pip install pandas

数据结构

Pandas 主要包含两种数据结构:Series 和 DataFrame。

  • Series 是一个一维数组,类似于 Python 中的列表。
  • DataFrame 是一个二维表格结构,类似于 Excel 或 CSV 文件。

创建 DataFrame

以下是一个简单的示例,展示如何创建一个 DataFrame:

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

选择数据

您可以使用 .loc.iloc 方法来选择 DataFrame 中的数据。

  • .loc 使用标签来选择数据。
  • .iloc 使用整数位置来选择数据。

以下是一个示例:

# 使用标签选择
print(df.loc['Alice', 'Age'])

# 使用位置选择
print(df.iloc[1, 1])

数据清洗

数据清洗是数据分析的重要步骤。Pandas 提供了多种方法来处理缺失值、重复值等。

以下是一个示例,展示如何处理缺失值:

df.fillna(value=0, inplace=True)

数据分析

Pandas 提供了丰富的数据分析功能,例如排序、分组、聚合等。

以下是一个示例,展示如何对 DataFrame 进行排序:

df.sort_values(by='Age', ascending=False, inplace=True)

图片示例

Pandas 图标

更多信息,请访问我们的 Pandas 教程 页面。