Pandas 是 Python 中一个非常强大的数据分析库,它提供了快速、灵活和直观的数据结构。以下是一些 Pandas 的基础教程。
快速入门
安装 Pandas
- 使用 pip 安装 Pandas:
pip install pandas
- 使用 pip 安装 Pandas:
创建 DataFrame
- DataFrame 是 Pandas 的核心数据结构,类似于表格。
import pandas as pd data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Los Angeles', 'Chicago'] } df = pd.DataFrame(data) print(df)
- DataFrame 是 Pandas 的核心数据结构,类似于表格。
选择数据
- 可以使用
.loc
和.iloc
来选择 DataFrame 中的数据。print(df.loc[0:2, 'Name']) # 选择行和列 print(df.iloc[1:3, 1:3]) # 使用整数索引
- 可以使用
高级功能
数据清洗
- 使用
dropna()
和fillna()
来处理缺失值。df.dropna(inplace=True) # 删除缺失值 df.fillna(0, inplace=True) # 用 0 填充缺失值
- 使用
数据聚合
- 使用
groupby()
和agg()
来进行数据聚合。result = df.groupby('City').agg({'Age': 'mean', 'Name': 'count'}) print(result)
- 使用
数据可视化
- 使用
matplotlib
和seaborn
来可视化数据。import matplotlib.pyplot as plt import seaborn as sns sns.barplot(x='City', y='Age', data=df) plt.show()
- 使用
扩展阅读
想要了解更多关于 Pandas 的内容,可以访问我们的 Pandas 教程页面。