Pandas 是一个强大的数据分析工具,它提供了快速、灵活且直观的数据结构。以下是一些 Pandas 的基本教程。

基础操作

  1. 安装 Pandas

    • 首先,您需要确保 Pandas 已经安装。如果没有,请访问 Pandas 安装指南
  2. 创建 DataFrame

    • DataFrame 是 Pandas 的核心数据结构。以下是如何创建一个简单的 DataFrame:
      import pandas as pd
      data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
      df = pd.DataFrame(data)
      
  3. 选择数据

    • 您可以使用 .loc.iloc 来选择 DataFrame 中的数据。
      # 使用 .loc
      print(df.loc[0])
      # 使用 .iloc
      print(df.iloc[1])
      
  4. 数据排序

    • 您可以使用 .sort_values() 来对 DataFrame 进行排序。
      print(df.sort_values(by='Age'))
      

高级操作

  1. 数据合并

    • Pandas 提供了多种数据合并方法,如 merge, join, concat 等。
      df1 = pd.DataFrame({'Key': ['B', 'C', 'D'], 'Value': [1, 3, 4]})
      df2 = pd.DataFrame({'Key': ['A', 'B', 'D'], 'Value': [5, 2, 2]})
      result = pd.merge(df1, df2, on='Key')
      print(result)
      
  2. 数据分组

    • 您可以使用 .groupby() 方法对数据进行分组。
      print(df.groupby('Name')['Age'].mean())
      

图片示例

DataFrame 的可视化可以通过图表来展示,例如使用 matplotlib:

import matplotlib.pyplot as plt
df.plot(kind='bar')
plt.show()

DataFrame 图表示例

更多 Pandas 图表教程


以上是 Pandas 的基础和高级操作教程。希望这些内容能帮助您更好地了解和使用 Pandas。