Pandas 是一个强大的数据分析库,它提供了快速、灵活和直观的数据结构。以下是一些关于 Pandas 的基本介绍和用法。

快速开始

要开始使用 Pandas,首先需要导入库:

import pandas as pd

然后,你可以创建一个 DataFrame,这是 Pandas 的主要数据结构:

data = {'Name': ['Tom', 'Nick', 'John'],
        'Age': [20, 21, 19],
        'City': ['New York', 'California', 'Texas']}
df = pd.DataFrame(data)

这样,你就创建了一个包含姓名、年龄和城市的 DataFrame。

数据操作

Pandas 提供了丰富的数据操作功能,例如:

  • 筛选数据:可以使用 lociloc 来筛选数据。
# 使用 loc 筛选年龄大于 20 的数据
filtered_df = df.loc[df['Age'] > 20]
  • 数据排序:可以使用 sort_values 方法来对数据进行排序。
# 按年龄降序排序
sorted_df = df.sort_values(by='Age', ascending=False)

图表可视化

Pandas 还可以与 Matplotlib、Seaborn 等库结合使用,进行数据可视化。

import matplotlib.pyplot as plt
import seaborn as sns

# 绘制散点图
sns.scatterplot(x='Age', y='City', data=df)
plt.show()

Age vs City

资源链接

更多关于 Pandas 的信息,您可以访问官方文档:Pandas 官方文档

返回首页