Pandas 是 Python 中一个非常强大的数据分析库,它提供了快速、灵活和直观的数据结构。以下是一些 Pandas 的基础教程。

快速入门

  1. 安装 Pandas

    • 使用 pip 安装 Pandas:
      pip install pandas
      
  2. 创建 DataFrame

    • DataFrame 是 Pandas 的核心数据结构,类似于表格。
      import pandas as pd
      
      data = {
          'Name': ['Alice', 'Bob', 'Charlie'],
          'Age': [25, 30, 35],
          'City': ['New York', 'Los Angeles', 'Chicago']
      }
      
      df = pd.DataFrame(data)
      print(df)
      
  3. 选择数据

    • 可以使用 .loc.iloc 来选择 DataFrame 中的数据。
      print(df.loc[0:2, 'Name'])  # 选择行和列
      print(df.iloc[1:3, 1:3])  # 使用整数索引
      

高级功能

  1. 数据清洗

    • 使用 dropna()fillna() 来处理缺失值。
      df.dropna(inplace=True)  # 删除缺失值
      df.fillna(0, inplace=True)  # 用 0 填充缺失值
      
  2. 数据聚合

    • 使用 groupby()agg() 来进行数据聚合。
      result = df.groupby('City').agg({'Age': 'mean', 'Name': 'count'})
      print(result)
      
  3. 数据可视化

    • 使用 matplotlibseaborn 来可视化数据。
      import matplotlib.pyplot as plt
      import seaborn as sns
      
      sns.barplot(x='City', y='Age', data=df)
      plt.show()
      

扩展阅读

想要了解更多关于 Pandas 的内容,可以访问我们的 Pandas 教程页面


Pandas Logo
DataFrame Structure