Pandas 是 Python 中一个强大的数据分析库,它提供了高效、灵活的数据结构,使得数据分析变得更加简单和便捷。以下是一些关于 Pandas 的基本概念和用法。
安装 Pandas
在开始之前,确保你已经安装了 Pandas。你可以使用以下命令进行安装:
pip install pandas
Pandas 的核心数据结构
Pandas 的核心数据结构是 DataFrame,它类似于一个表格,由行和列组成。DataFrame 可以用来存储和操作数据。
创建 DataFrame
import pandas as pd
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19],
'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
print(df)
选择数据
你可以使用多种方式来选择 DataFrame 中的数据。
- 使用列名:
print(df['Name'])
- 使用列名列表:
print(df[['Name', 'Age']])
- 使用条件:
print(df[df['Age'] > 20])
数据操作
Pandas 提供了丰富的数据操作功能,包括排序、过滤、分组等。
排序
df.sort_values(by='Age', ascending=False)
过滤
print(df[df['City'] == 'New York'])
分组
df.groupby('City').mean()
高级功能
Pandas 还提供了许多高级功能,例如:
- 时间序列分析
- 文本分析
- 图形可视化
学习资源
更多关于 Pandas 的学习资源,请访问我们的 Pandas 教程。
Pandas 图标