Pandas 是 Python 中一个强大的数据分析库,它提供了数据结构和数据分析工具,可以帮助你进行数据清洗、转换和分析。
快速入门
安装 Pandas
- 使用 pip 安装 Pandas:
pip install pandas
- 使用 pip 安装 Pandas:
导入 Pandas
- 在 Python 脚本中导入 Pandas:
import pandas as pd
- 在 Python 脚本中导入 Pandas:
创建 DataFrame
- DataFrame 是 Pandas 中的主要数据结构,类似于 Excel 表格或 SQL 表。
data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Los Angeles', 'Chicago'] } df = pd.DataFrame(data)
- DataFrame 是 Pandas 中的主要数据结构,类似于 Excel 表格或 SQL 表。
基本操作
- 选择列:
df['Name']
- 选择行:
df.iloc[1:3]
- 转置 DataFrame:
df.T
- 选择列:
实用技巧
- 数据清洗: 使用
dropna()
删除缺失值,使用fillna()
填充缺失值。 - 数据转换: 使用
to_datetime()
转换日期格式,使用apply()
应用函数。 - 数据聚合: 使用
groupby()
对数据进行分组,使用sum()
、mean()
等函数进行聚合。
学习资源
Pandas 图标