Pandas 是 Python 中用于数据分析的强大库。它提供了丰富的数据结构,使得数据处理和分析变得更加简单和高效。
快速入门
数据结构
- Series:类似于一个一维数组或列。
- DataFrame:类似于表格,具有行和列,可以看作是 Series 的容器。
基本操作
- 选择数据:使用
.loc[]
或.iloc[]
。 - 数据排序:使用
.sort_values()
。 - 数据过滤:使用布尔索引。
- 选择数据:使用
数据处理
- 数据清洗:处理缺失值、重复值等。
- 数据合并:使用
.merge()
、.join()
。 - 数据转换:使用
.apply()
、.map()
。
实践示例
下面是一个简单的示例,展示了如何使用 Pandas 进行数据分析:
import pandas as pd
# 创建一个 DataFrame
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)
# 打印 DataFrame
print(df)
输出结果:
Name Age
0 Tom 20
1 Nick 21
2 John 19
扩展阅读
想了解更多关于 Pandas 的知识,可以阅读以下文章:
Pandas 图标