Pandas 是 Python 中一个非常强大的数据分析库,它提供了高效的数据结构和数据分析工具。以下是一些 Pandas 的基本教程:

基础概念

  • Series:类似于一维数组,可以包含任何数据类型。
  • DataFrame:类似于表格的数据结构,包含行和列。
  • 索引:用于标识数据中的行或列。

常用操作

  • 读取数据:可以使用 read_csvread_excel 等函数读取数据。
  • 数据筛选:可以使用布尔索引或 lociloc 函数进行数据筛选。
  • 数据排序:可以使用 sort_values 函数进行排序。
  • 数据聚合:可以使用 groupbyagg 函数进行数据聚合。

示例

以下是一个简单的示例:

import pandas as pd

# 读取数据
data = pd.read_csv('data.csv')

# 筛选数据
filtered_data = data[data['age'] > 30]

# 排序数据
sorted_data = filtered_data.sort_values(by='age', ascending=False)

# 数据聚合
aggregated_data = sorted_data.groupby('age').count()

扩展阅读

Pandas Logo