Pandas 教程

Pandas 是 Python 中一个强大的数据分析库，它提供了快速、灵活、直观的数据结构和数据分析工具。以下是一些 Pandas 的基本教程内容。

安装 Pandas

在开始使用 Pandas 之前，您需要确保已经安装了 Pandas 库。您可以使用以下命令来安装：

pip install pandas

基本数据结构

Pandas 中的主要数据结构是 DataFrame，它类似于 Excel 中的表格，可以存储二维数据。

import pandas as pd

# 创建一个 DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

print(df)

选择数据

您可以使用 .loc 和 .iloc 来选择 DataFrame 中的数据。

# 使用 .loc 选择数据
print(df.loc[0:2, 'Name'])

# 使用 .iloc 选择数据
print(df.iloc[1:3, 1])

数据处理

Pandas 提供了丰富的数据处理功能，例如数据清洗、数据转换等。

# 数据清洗
df.dropna(inplace=True)  # 删除缺失值

# 数据转换
df['Age'] = df['Age'].apply(lambda x: x + 1)  # 年龄加 1

数据可视化

Pandas 与 Matplotlib 或 Seaborn 等库结合，可以方便地进行数据可视化。

import matplotlib.pyplot as plt

df.plot(kind='bar')
plt.show()

扩展阅读

如果您想了解更多关于 Pandas 的内容，可以访问以下链接：

Pandas 官方文档