Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活且易于使用的数据结构和数据分析工具。本文将为您介绍 Pandas 的基本概念和使用方法。
安装 Pandas
在开始使用 Pandas 之前,您需要确保已经安装了 Pandas 库。您可以使用以下命令进行安装:
pip install pandas
数据结构
Pandas 提供了两种主要的数据结构:Series 和 DataFrame。
- Series 是一个一维的数组,类似于 Python 中的列表。
- DataFrame 是一个二维的表格,类似于 Excel 文件。
Series 示例
import pandas as pd
# 创建一个 Series
data = pd.Series([1, 2, 3, 4, 5])
print(data)
DataFrame 示例
import pandas as pd
# 创建一个 DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [25, 30, 35, 40]
}
df = pd.DataFrame(data)
print(df)
数据操作
Pandas 提供了丰富的数据操作功能,包括数据选择、数据排序、数据过滤等。
数据选择
# 选择特定列
print(df['Name'])
# 选择多列
print(df[['Name', 'Age']])
# 选择特定行
print(df.iloc[1:3])
数据排序
# 按年龄排序
df_sorted = df.sort_values(by='Age')
print(df_sorted)
数据过滤
# 过滤年龄大于 30 的数据
print(df[df['Age'] > 30])
高级功能
Pandas 还提供了许多高级功能,例如:
- 数据合并
- 数据分组
- 时间序列分析
- 数据可视化
更多高级功能,请访问我们的 Pandas 教程。
Pandas Logo