Pandas 是 Python 中一个强大的数据分析库,它提供了数据结构和数据分析工具,可以让你轻松处理和分析数据。以下是一些 Pandas 的基本概念和操作。

安装 Pandas

首先,确保你已经安装了 Pandas。如果没有,可以使用以下命令进行安装:

pip install pandas

数据结构

Pandas 提供了两种主要的数据结构:DataFrameSeries

  • DataFrame:类似于表格,由行和列组成。
  • Series:一维数组,可以看作是 DataFrame 的列。

快速入门

以下是一些 Pandas 的基本操作:

  • 读取数据:使用 read_csv 函数读取 CSV 文件。
import pandas as pd

df = pd.read_csv('data.csv')
  • 查看数据:使用 headtailinfodescribe 函数。
print(df.head())
print(df.tail())
print(df.info())
print(df.describe())
  • 筛选数据:使用布尔索引。
print(df[df['column_name'] > 0])
  • 排序数据:使用 sort_values 函数。
print(df.sort_values(by='column_name', ascending=False))
  • 聚合数据:使用 groupby 函数。
print(df.groupby('column_name').sum())
  • 绘图:使用 matplotlibseaborn 进行绘图。
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))
plt.plot(df['column_name'])
plt.show()

学习资源

更多关于 Pandas 的学习资源,请访问我们的 Pandas 教程

Pandas Logo