Pandas 是 Python 中一个非常强大的数据分析库,它提供了高效、灵活的数据结构和数据分析工具。以下是一些 Pandas 的基础教程内容。
快速入门
安装 Pandas
- 使用 pip 安装 Pandas:
pip install pandas
- 使用 pip 安装 Pandas:
创建 DataFrame
- DataFrame 是 Pandas 的核心数据结构,类似于表格。
import pandas as pd data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Los Angeles', 'Chicago'] } df = pd.DataFrame(data)
- DataFrame 是 Pandas 的核心数据结构,类似于表格。
基本操作
- 查看数据概览:
df.info()
- 选择列:
df['Name']
- 选择行:
df.loc[1:2]
- 查看数据概览:
高级应用
数据清洗
- 删除缺失值:
df.dropna()
- 填充缺失值:
df.fillna(0)
- 删除缺失值:
数据聚合
- 按列聚合:
df.groupby('City')['Age'].mean()
- 按列聚合:
数据可视化
- 使用 matplotlib 或 seaborn 进行可视化。
import matplotlib.pyplot as plt df.plot(kind='bar') plt.show()
- 使用 matplotlib 或 seaborn 进行可视化。
扩展阅读
更多 Pandas 教程,请访问本站 Pandas 教程页面。