Pandas 是一个强大的数据分析库,它提供了快速、灵活和直观的数据结构。以下是一些关于 Pandas 的基本介绍和用法。
快速开始
要开始使用 Pandas,首先需要导入库:
import pandas as pd
然后,你可以创建一个 DataFrame,这是 Pandas 的主要数据结构:
data = {'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19],
'City': ['New York', 'California', 'Texas']}
df = pd.DataFrame(data)
这样,你就创建了一个包含姓名、年龄和城市的 DataFrame。
数据操作
Pandas 提供了丰富的数据操作功能,例如:
- 筛选数据:可以使用
loc
或iloc
来筛选数据。
# 使用 loc 筛选年龄大于 20 的数据
filtered_df = df.loc[df['Age'] > 20]
- 数据排序:可以使用
sort_values
方法来对数据进行排序。
# 按年龄降序排序
sorted_df = df.sort_values(by='Age', ascending=False)
图表可视化
Pandas 还可以与 Matplotlib、Seaborn 等库结合使用,进行数据可视化。
import matplotlib.pyplot as plt
import seaborn as sns
# 绘制散点图
sns.scatterplot(x='Age', y='City', data=df)
plt.show()
Age vs City
资源链接
更多关于 Pandas 的信息,您可以访问官方文档:Pandas 官方文档