Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活、直观的数据结构和数据分析工具。以下是一些 Pandas 的基本教程内容。

安装 Pandas

在开始使用 Pandas 之前,您需要确保已经安装了 Pandas 库。您可以使用以下命令来安装:

pip install pandas

基本数据结构

Pandas 中的主要数据结构是 DataFrame,它类似于 Excel 中的表格,可以存储二维数据。

import pandas as pd

# 创建一个 DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

print(df)

选择数据

您可以使用 .loc.iloc 来选择 DataFrame 中的数据。

# 使用 .loc 选择数据
print(df.loc[0:2, 'Name'])

# 使用 .iloc 选择数据
print(df.iloc[1:3, 1])

数据处理

Pandas 提供了丰富的数据处理功能,例如数据清洗、数据转换等。

# 数据清洗
df.dropna(inplace=True)  # 删除缺失值

# 数据转换
df['Age'] = df['Age'].apply(lambda x: x + 1)  # 年龄加 1

数据可视化

Pandas 与 Matplotlib 或 Seaborn 等库结合,可以方便地进行数据可视化。

import matplotlib.pyplot as plt

df.plot(kind='bar')
plt.show()

扩展阅读

如果您想了解更多关于 Pandas 的内容,可以访问以下链接:

Pandas Logo