Pandas 教程

Pandas 是 Python 中一个非常强大的数据分析库，它提供了快速、灵活和直观的数据结构。以下是一些 Pandas 的基础教程。

快速入门

安装 Pandas
- 使用 pip 安装 Pandas：
```
pip install pandas
```

创建 DataFrame

DataFrame 是 Pandas 的核心数据结构，类似于表格。

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)
print(df)

选择数据

可以使用 .loc 和 .iloc 来选择 DataFrame 中的数据。

print(df.loc[0:2, 'Name'])  # 选择行和列
print(df.iloc[1:3, 1:3])  # 使用整数索引

高级功能

数据清洗

使用 dropna() 和 fillna() 来处理缺失值。

df.dropna(inplace=True)  # 删除缺失值
df.fillna(0, inplace=True)  # 用 0 填充缺失值

数据聚合

使用 groupby() 和 agg() 来进行数据聚合。

result = df.groupby('City').agg({'Age': 'mean', 'Name': 'count'})
print(result)

数据可视化

使用 matplotlib 和 seaborn 来可视化数据。

import matplotlib.pyplot as plt
import seaborn as sns

sns.barplot(x='City', y='Age', data=df)
plt.show()

扩展阅读

想要了解更多关于 Pandas 的内容，可以访问我们的 Pandas 教程页面。