Pandas 是 Python 中一个强大的数据分析库,以下是一些 Pandas 的小贴士,帮助你更高效地处理数据。
快速访问数据
使用 .loc
和 .iloc
可以快速访问 DataFrame 中的数据。
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3],
'B': [4, 5, 6]
})
# 使用 .loc
print(df.loc[1, 'A']) # 输出: 2
# 使用 .iloc
print(df.iloc[2, 1]) # 输出: 6
数据清洗
数据清洗是数据分析的重要步骤,以下是一些常用的数据清洗方法。
- 删除重复值:
df.drop_duplicates()
- 删除缺失值:
df.dropna()
- 填充缺失值:
df.fillna()
数据透视表
数据透视表可以方便地汇总数据。
pivot_table = df.pivot_table(values='A', index='B', aggfunc='sum')
print(pivot_table)
链接
更多 Pandas 相关的内容,请访问我们的 Pandas 教程。
图片
Pandas Logo