Pandas 是 Python 中一个强大的数据分析库,它可以轻松地进行数据清洗、转换和分析。以下是一些 Pandas 的基本教程,帮助你快速上手。

快速入门

  1. 安装 Pandas

    • 首先,你需要安装 Pandas。你可以使用 pip 来安装:
      pip install pandas
      
  2. 导入 Pandas

    • 在 Python 中导入 Pandas:
      import pandas as pd
      
  3. 创建 DataFrame

    • DataFrame 是 Pandas 的核心数据结构,你可以使用以下方式创建一个简单的 DataFrame:
      data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
      df = pd.DataFrame(data)
      
  4. 查看 DataFrame

    • 使用 df.head() 可以查看 DataFrame 的前几行:
      df.head()
      

高级功能

  1. 数据清洗

    • Pandas 提供了丰富的数据清洗功能,例如:
      • 删除缺失值:df.dropna()
      • 填充缺失值:df.fillna()
      • 处理重复值:df.drop_duplicates()
  2. 数据处理

    • Pandas 支持各种数据处理操作,例如:
      • 选择列:df['Name']
      • 选择行:df.loc[0:2]
      • 转置:df.transpose()
  3. 数据聚合

    • Pandas 提供了强大的数据聚合功能,例如:
      • 求和:df.sum()
      • 平均值:df.mean()
      • 最大值:df.max()
  4. 数据可视化

    • Pandas 可以与 Matplotlib、Seaborn 等库结合进行数据可视化。例如,你可以使用以下代码创建一个简单的柱状图:
      import matplotlib.pyplot as plt
      df.plot(kind='bar')
      plt.show()
      

更多 Pandas 教程

Pandas Logo