Pandas 是 Python 中一个强大的数据分析库,它提供了数据结构和数据分析工具,可以帮助你进行数据清洗、转换和分析。

快速入门

  1. 安装 Pandas

    • 使用 pip 安装 Pandas:
      pip install pandas
      
  2. 导入 Pandas

    • 在 Python 脚本中导入 Pandas:
      import pandas as pd
      
  3. 创建 DataFrame

    • DataFrame 是 Pandas 中的主要数据结构,类似于 Excel 表格或 SQL 表。
      data = {
          'Name': ['Alice', 'Bob', 'Charlie'],
          'Age': [25, 30, 35],
          'City': ['New York', 'Los Angeles', 'Chicago']
      }
      df = pd.DataFrame(data)
      
  4. 基本操作

    • 选择列:
      df['Name']
      
    • 选择行:
      df.iloc[1:3]
      
    • 转置 DataFrame:
      df.T
      

实用技巧

  • 数据清洗: 使用 dropna() 删除缺失值,使用 fillna() 填充缺失值。
  • 数据转换: 使用 to_datetime() 转换日期格式,使用 apply() 应用函数。
  • 数据聚合: 使用 groupby() 对数据进行分组,使用 sum()mean() 等函数进行聚合。

学习资源

深入学习 Pandas

Pandas 图标