Pandas 是 Python 中一个强大的数据分析库,它提供了高效、灵活的数据结构和数据分析工具。以下是一些 Pandas 入门的基础知识。
安装 Pandas
首先,确保你已经安装了 Python。然后,使用以下命令安装 Pandas:
pip install pandas
基础概念
数据结构
Pandas 中最常用的数据结构是 DataFrame。DataFrame 是一个表格型的数据结构,它包含行和列,类似于 Excel 或 CSV 文件。
基本操作
- 读取数据:使用
pandas.read_csv()
或pandas.read_excel()
读取数据。 - 查看数据:使用
df.head()
查看前几行数据。 - 筛选数据:使用
df[df['列名'] > 值]
筛选数据。 - 排序数据:使用
df.sort_values('列名')
对数据排序。
实例
假设我们有一个名为 data.csv
的文件,包含以下数据:
id,name,age,city
1,John,25,New York
2,Jane,22,Los Angeles
3,Bob,30,Chicago
我们可以使用 Pandas 读取这个文件:
import pandas as pd
df = pd.read_csv('data.csv')
现在,我们想要筛选出年龄大于 25 的人:
filtered_df = df[df['age'] > 25]
学习资源
想要深入了解 Pandas,可以访问我们网站的 Pandas 高级教程。
Pandas DataFrame 示例