Pandas 是 Python 中一个非常强大的数据分析库,它提供了快速、灵活和直观的数据结构。以下是一些 Pandas 的基本概念和操作。
快速开始
- 安装 Pandas: 首先,确保你已经安装了 Pandas。如果没有,可以通过以下命令进行安装:
pip install pandas
- 导入 Pandas: 在 Python 脚本中,你需要导入 Pandas 库:
import pandas as pd
基本概念
- Series: 类似于一维数组,可以包含任何数据类型。
- DataFrame: 类似于表格,可以包含多列数据。
示例
假设我们有一个 CSV 文件 data.csv
,包含以下数据:
name | age | city |
---|---|---|
Alice | 28 | New York |
Bob | 32 | Los Angeles |
Carol | 24 | Chicago |
使用 Pandas 读取这个文件:
df = pd.read_csv('data.csv')
现在,df
就是一个 DataFrame,你可以通过列名访问数据:
print(df['name'])
高级操作
- 筛选数据: 可以使用
.loc
或.iloc
来筛选数据。 - 数据排序: 使用
.sort_values()
方法可以对数据进行排序。 - 数据分组: 使用
.groupby()
方法可以对数据进行分组。
更多资源
想要深入学习 Pandas,可以访问以下链接: