Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活和直观的数据结构,用于数据分析。本教程将为您介绍 Pandas 的基本用法和高级功能。

安装 Pandas

在开始使用 Pandas 之前,您需要确保已经安装了 Pandas 库。您可以使用以下命令进行安装:

pip install pandas

快速入门

以下是一些 Pandas 的基本操作:

  • 创建 DataFrame:DataFrame 是 Pandas 中的主要数据结构,类似于表格。
import pandas as pd

data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)
print(df)
  • 数据选择:您可以使用多种方式选择 DataFrame 中的数据。
print(df['Name'])  # 选择 Name 列
print(df['Name', 'City'])  # 选择多列
print(df.iloc[1:3])  # 选择行
  • 数据操作:Pandas 提供了许多数据操作功能,例如排序、过滤和聚合。
df.sort_values(by='Age', ascending=True)
df.query('Age > 20')
df.groupby('City').mean()

高级功能

Pandas 的高级功能包括:

  • 时间序列:Pandas 支持时间序列数据,可以方便地进行时间相关的操作。
import pandas as pd

# 创建时间序列
time_series = pd.Series([1, 2, 3, 4, 5], index=pd.date_range('20210101', periods=5))

# 时间序列操作
time_series.resample('M').sum()
  • 绘图:Pandas 可以与 Matplotlib 或 Seaborn 等库结合使用,进行数据可视化。
import matplotlib.pyplot as plt

df.plot(kind='line')
plt.show()

扩展阅读

如果您想了解更多关于 Pandas 的内容,可以阅读以下链接:

Pandas Logo