Pandas 是一个强大的数据分析库,它提供了快速、灵活和直观的数据结构。以下是一些关于 Pandas 的基础知识和技巧。
快速开始
安装 Pandas
首先,您需要安装 Pandas。您可以通过以下命令进行安装:
pip install pandas
创建 DataFrame
DataFrame 是 Pandas 的核心数据结构。以下是一个简单的例子:
import pandas as pd
data = {
'Name': ['Tom', 'Nick', 'John'],
'Age': [20, 21, 19],
'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
选择和筛选数据
您可以使用 .loc
和 .iloc
来选择和筛选数据:
# 通过标签选择
df.loc[df['Age'] > 20]
# 通过位置选择
df.iloc[1:3, :]
高级功能
合并和连接
Pandas 提供了多种合并和连接数据的方法:
merge()
join()
concat()
数据清洗
数据清洗是数据分析的重要步骤。以下是一些常用的数据清洗方法:
- 删除缺失值:
dropna()
- 填充缺失值:
fillna()
- 删除重复值:
drop_duplicates()
学习资源
如果您想深入学习 Pandas,以下是一些推荐的资源:
Pandas Logo