Pandas 是 Python 中一个强大的数据分析库,它提供了数据结构 DataFrames 和丰富的数据分析工具。以下是一些 Pandas 教程的基础内容。
安装 Pandas
首先,您需要安装 Pandas 库。您可以使用 pip 命令进行安装:
pip install pandas
基础数据结构
Pandas 中的主要数据结构是 DataFrame。DataFrame 类似于 Excel 表格,由行和列组成。
import pandas as pd
# 创建一个简单的 DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
print(df)
数据操作
Pandas 提供了丰富的数据操作功能,例如数据筛选、排序、分组等。
# 筛选年龄大于 30 的数据
filtered_df = df[df['Age'] > 30]
print(filtered_df)
数据可视化
Pandas 还可以与 Matplotlib、Seaborn 等库结合使用进行数据可视化。
import matplotlib.pyplot as plt
import seaborn as sns
# 绘制散点图
sns.scatterplot(x='Age', y='City', data=df)
plt.show()
扩展阅读
想要了解更多关于 Pandas 的内容,可以阅读以下教程:
图片示例
New_York
Los_Angeles
Chicago