Pandas 文档介绍

Pandas 是一个强大的数据分析库，它提供了快速、灵活和直观的数据结构。以下是一些关于 Pandas 的基本介绍和用法。

快速开始

要开始使用 Pandas，首先需要导入库：

import pandas as pd

然后，你可以创建一个 DataFrame，这是 Pandas 的主要数据结构：

data = {'Name': ['Tom', 'Nick', 'John'],
        'Age': [20, 21, 19],
        'City': ['New York', 'California', 'Texas']}
df = pd.DataFrame(data)

这样，你就创建了一个包含姓名、年龄和城市的 DataFrame。

Pandas 提供了丰富的数据操作功能，例如：

# 使用 loc 筛选年龄大于 20 的数据
filtered_df = df.loc[df['Age'] > 20]

# 按年龄降序排序
sorted_df = df.sort_values(by='Age', ascending=False)

Pandas 还可以与 Matplotlib、Seaborn 等库结合使用，进行数据可视化。

import matplotlib.pyplot as plt
import seaborn as sns

# 绘制散点图
sns.scatterplot(x='Age', y='City', data=df)
plt.show()

更多关于 Pandas 的信息，您可以访问官方文档：Pandas 官方文档