Pandas 是 Python 中一个强大的数据分析库,它提供了数据结构 DataFrame 和一系列数据分析工具。本教程将为您介绍 Pandas 的基本使用方法。
安装 Pandas
在开始之前,请确保您已经安装了 Pandas。您可以使用以下命令进行安装:
pip install pandas
DataFrame 基础
DataFrame 是 Pandas 的核心数据结构,类似于 Excel 表格或 SQL 表。以下是一个简单的 DataFrame 示例:
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
print(df)
输出结果:
Name | Age | City |
---|---|---|
Alice | 25 | New York |
Bob | 30 | Los Angeles |
Charlie | 35 | Chicago |
数据操作
Pandas 提供了丰富的数据操作功能,包括选择、过滤、排序等。
选择数据
# 选择所有 Age 大于 30 的数据
df_filtered = df[df['Age'] > 30]
print(df_filtered)
输出结果:
Name | Age | City |
---|---|---|
Bob | 30 | Los Angeles |
Charlie | 35 | Chicago |
过滤数据
# 过滤出 City 为 'New York' 的数据
df_filtered = df[df['City'] == 'New York']
print(df_filtered)
输出结果:
Name | Age | City |
---|---|---|
Alice | 25 | New York |
数据可视化
Pandas 可以与 Matplotlib、Seaborn 等库结合进行数据可视化。
import matplotlib.pyplot as plt
df.plot(kind='bar', x='Name', y='Age')
plt.show()
Pandas 数据可视化
扩展阅读
如果您想了解更多关于 Pandas 的知识,可以访问以下链接:
希望这个教程对您有所帮助!👍