Pandas 是 Python 中一个强大的数据分析库,它可以轻松地进行数据清洗、转换和分析。以下是一些 Pandas 的基本教程,帮助你快速上手。
快速入门
安装 Pandas
- 首先,你需要安装 Pandas。你可以使用 pip 来安装:
pip install pandas
- 首先,你需要安装 Pandas。你可以使用 pip 来安装:
导入 Pandas
- 在 Python 中导入 Pandas:
import pandas as pd
- 在 Python 中导入 Pandas:
创建 DataFrame
- DataFrame 是 Pandas 的核心数据结构,你可以使用以下方式创建一个简单的 DataFrame:
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]} df = pd.DataFrame(data)
- DataFrame 是 Pandas 的核心数据结构,你可以使用以下方式创建一个简单的 DataFrame:
查看 DataFrame
- 使用
df.head()
可以查看 DataFrame 的前几行:df.head()
- 使用
高级功能
数据清洗
- Pandas 提供了丰富的数据清洗功能,例如:
- 删除缺失值:
df.dropna()
- 填充缺失值:
df.fillna()
- 处理重复值:
df.drop_duplicates()
- 删除缺失值:
- Pandas 提供了丰富的数据清洗功能,例如:
数据处理
- Pandas 支持各种数据处理操作,例如:
- 选择列:
df['Name']
- 选择行:
df.loc[0:2]
- 转置:
df.transpose()
- 选择列:
- Pandas 支持各种数据处理操作,例如:
数据聚合
- Pandas 提供了强大的数据聚合功能,例如:
- 求和:
df.sum()
- 平均值:
df.mean()
- 最大值:
df.max()
- 求和:
- Pandas 提供了强大的数据聚合功能,例如:
数据可视化
- Pandas 可以与 Matplotlib、Seaborn 等库结合进行数据可视化。例如,你可以使用以下代码创建一个简单的柱状图:
import matplotlib.pyplot as plt df.plot(kind='bar') plt.show()
- Pandas 可以与 Matplotlib、Seaborn 等库结合进行数据可视化。例如,你可以使用以下代码创建一个简单的柱状图:
Pandas Logo