Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活且易于使用的数据结构和数据分析工具。本文将为您介绍 Pandas 的基本概念和使用方法。

安装 Pandas

在开始使用 Pandas 之前,您需要确保已经安装了 Pandas 库。您可以使用以下命令进行安装:

pip install pandas

数据结构

Pandas 提供了两种主要的数据结构:SeriesDataFrame

  • Series 是一个一维的数组,类似于 Python 中的列表。
  • DataFrame 是一个二维的表格,类似于 Excel 文件。

Series 示例

import pandas as pd

# 创建一个 Series
data = pd.Series([1, 2, 3, 4, 5])

print(data)

DataFrame 示例

import pandas as pd

# 创建一个 DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie', 'David'],
    'Age': [25, 30, 35, 40]
}

df = pd.DataFrame(data)

print(df)

数据操作

Pandas 提供了丰富的数据操作功能,包括数据选择、数据排序、数据过滤等。

数据选择

# 选择特定列
print(df['Name'])

# 选择多列
print(df[['Name', 'Age']])

# 选择特定行
print(df.iloc[1:3])

数据排序

# 按年龄排序
df_sorted = df.sort_values(by='Age')
print(df_sorted)

数据过滤

# 过滤年龄大于 30 的数据
print(df[df['Age'] > 30])

高级功能

Pandas 还提供了许多高级功能,例如:

  • 数据合并
  • 数据分组
  • 时间序列分析
  • 数据可视化

更多高级功能,请访问我们的 Pandas 教程

Pandas Logo