Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活和直观的数据结构,用于数据分析。本教程将为您介绍 Pandas 的基本用法和高级功能。
安装 Pandas
在开始使用 Pandas 之前,您需要确保已经安装了 Pandas 库。您可以使用以下命令进行安装:
pip install pandas
快速入门
以下是一些 Pandas 的基本操作:
- 创建 DataFrame:DataFrame 是 Pandas 中的主要数据结构,类似于表格。
import pandas as pd
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19],
'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
print(df)
- 数据选择:您可以使用多种方式选择 DataFrame 中的数据。
print(df['Name']) # 选择 Name 列
print(df['Name', 'City']) # 选择多列
print(df.iloc[1:3]) # 选择行
- 数据操作:Pandas 提供了许多数据操作功能,例如排序、过滤和聚合。
df.sort_values(by='Age', ascending=True)
df.query('Age > 20')
df.groupby('City').mean()
高级功能
Pandas 的高级功能包括:
- 时间序列:Pandas 支持时间序列数据,可以方便地进行时间相关的操作。
import pandas as pd
# 创建时间序列
time_series = pd.Series([1, 2, 3, 4, 5], index=pd.date_range('20210101', periods=5))
# 时间序列操作
time_series.resample('M').sum()
- 绘图:Pandas 可以与 Matplotlib 或 Seaborn 等库结合使用,进行数据可视化。
import matplotlib.pyplot as plt
df.plot(kind='line')
plt.show()
扩展阅读
如果您想了解更多关于 Pandas 的内容,可以阅读以下链接:
Pandas Logo