Pandas 是 Python 中一个非常强大的数据分析库,它提供了高效的数据结构和数据分析工具。以下是一些 Pandas 的基本教程:
基础概念
- Series:类似于一维数组,可以包含任何数据类型。
- DataFrame:类似于表格的数据结构,包含行和列。
- 索引:用于标识数据中的行或列。
常用操作
- 读取数据:可以使用
read_csv
、read_excel
等函数读取数据。 - 数据筛选:可以使用布尔索引或
loc
、iloc
函数进行数据筛选。 - 数据排序:可以使用
sort_values
函数进行排序。 - 数据聚合:可以使用
groupby
和agg
函数进行数据聚合。
示例
以下是一个简单的示例:
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 筛选数据
filtered_data = data[data['age'] > 30]
# 排序数据
sorted_data = filtered_data.sort_values(by='age', ascending=False)
# 数据聚合
aggregated_data = sorted_data.groupby('age').count()
扩展阅读
Pandas Logo