Pandas 是 Python 中一个非常强大的数据分析库,它提供了高效、灵活的数据结构和数据分析工具。以下是一些 Pandas 的基础教程内容。

快速入门

  1. 安装 Pandas

    • 使用 pip 安装 Pandas:
      pip install pandas
      
  2. 创建 DataFrame

    • DataFrame 是 Pandas 的核心数据结构,类似于表格。
      import pandas as pd
      
      data = {
          'Name': ['Alice', 'Bob', 'Charlie'],
          'Age': [25, 30, 35],
          'City': ['New York', 'Los Angeles', 'Chicago']
      }
      df = pd.DataFrame(data)
      
  3. 基本操作

    • 查看数据概览:
      df.info()
      
    • 选择列:
      df['Name']
      
    • 选择行:
      df.loc[1:2]
      

高级应用

  1. 数据清洗

    • 删除缺失值:
      df.dropna()
      
    • 填充缺失值:
      df.fillna(0)
      
  2. 数据聚合

    • 按列聚合:
      df.groupby('City')['Age'].mean()
      
  3. 数据可视化

    • 使用 matplotlib 或 seaborn 进行可视化。
      import matplotlib.pyplot as plt
      df.plot(kind='bar')
      plt.show()
      

扩展阅读

更多 Pandas 教程,请访问本站 Pandas 教程页面


图片示例

  • DataFrame
  • Pandas Plot