Pandas 是 Python 中一个强大的数据分析库,它提供了高效、灵活的数据结构和数据分析工具。以下是一些 Pandas 入门的基础知识。

安装 Pandas

首先,确保你已经安装了 Python。然后,使用以下命令安装 Pandas:

pip install pandas

基础概念

数据结构

Pandas 中最常用的数据结构是 DataFrame。DataFrame 是一个表格型的数据结构,它包含行和列,类似于 Excel 或 CSV 文件。

基本操作

  • 读取数据:使用 pandas.read_csv()pandas.read_excel() 读取数据。
  • 查看数据:使用 df.head() 查看前几行数据。
  • 筛选数据:使用 df[df['列名'] > 值] 筛选数据。
  • 排序数据:使用 df.sort_values('列名') 对数据排序。

实例

假设我们有一个名为 data.csv 的文件,包含以下数据:

id,name,age,city
1,John,25,New York
2,Jane,22,Los Angeles
3,Bob,30,Chicago

我们可以使用 Pandas 读取这个文件:

import pandas as pd

df = pd.read_csv('data.csv')

现在,我们想要筛选出年龄大于 25 的人:

filtered_df = df[df['age'] > 25]

学习资源

想要深入了解 Pandas,可以访问我们网站的 Pandas 高级教程

Pandas DataFrame 示例