Pandas 是 Python 中一个强大的数据分析库,以下是一些 Pandas 的小贴士,帮助你更高效地处理数据。

快速访问数据

使用 .loc.iloc 可以快速访问 DataFrame 中的数据。

import pandas as pd

df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6]
})

# 使用 .loc
print(df.loc[1, 'A'])  # 输出: 2

# 使用 .iloc
print(df.iloc[2, 1])  # 输出: 6

数据清洗

数据清洗是数据分析的重要步骤,以下是一些常用的数据清洗方法。

  • 删除重复值:df.drop_duplicates()
  • 删除缺失值:df.dropna()
  • 填充缺失值:df.fillna()

数据透视表

数据透视表可以方便地汇总数据。

pivot_table = df.pivot_table(values='A', index='B', aggfunc='sum')
print(pivot_table)

链接

更多 Pandas 相关的内容,请访问我们的 Pandas 教程

图片

Pandas Logo