Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活且易于使用的数据结构,用于数据分析。以下是一些 Pandas 的基本教程。
安装 Pandas
pip install pandas
快速开始
1. 创建 DataFrame
DataFrame 是 Pandas 的核心数据结构,类似于 R 中的数据框或 SQL 中的表。
import pandas as pd
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19],
'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
print(df)
2. 选择数据
你可以使用 .loc
和 .iloc
来选择 DataFrame 中的数据。
# 使用标签选择
print(df.loc[df['Name'] == 'Tom'])
# 使用整数索引选择
print(df.iloc[1:3])
3. 数据操作
Pandas 提供了丰富的数据操作功能,如排序、过滤、聚合等。
# 排序
print(df.sort_values(by='Age'))
# 过滤
print(df[df['City'] == 'London'])
# 聚合
print(df.groupby('City').mean())
扩展阅读
更多 Pandas 教程,请访问我们的 Pandas 教程页面。
图片
Pandas Logo