Pandas 是 Python 中一个非常流行的数据分析库,它提供了强大的数据结构和数据分析工具。以下是一些 Pandas 的基础教程,帮助你快速入门。

快速入门

  1. 安装 Pandas

    • 首先,你需要安装 Pandas。你可以通过以下命令来安装:
      pip install pandas
      
  2. 导入 Pandas

    • 在你的 Python 脚本中,导入 Pandas 库:
      import pandas as pd
      
  3. 创建 DataFrame

    • DataFrame 是 Pandas 的核心数据结构,用于存储表格数据。
      data = {
          'Name': ['Alice', 'Bob', 'Charlie'],
          'Age': [25, 30, 35],
          'City': ['New York', 'Los Angeles', 'Chicago']
      }
      df = pd.DataFrame(data)
      
  4. 查看 DataFrame

    • 使用 df.head()df.tail() 来查看 DataFrame 的前几行或后几行:
      print(df.head())
      

高级操作

  1. 筛选数据

    • 使用条件语句来筛选 DataFrame 中的数据。
      filtered_df = df[df['Age'] > 28]
      
  2. 排序

    • 使用 df.sort_values() 来对 DataFrame 进行排序。
      sorted_df = df.sort_values(by='Age', ascending=False)
      
  3. 聚合

    • 使用 df.groupby() 来对 DataFrame 进行分组,并计算每个组的聚合值。
      grouped_df = df.groupby('City').agg({'Age': ['mean', 'sum']})
      

扩展阅读

想要了解更多关于 Pandas 的知识,可以阅读我们的 Pandas 进阶教程

图片示例

Pandas Logo

[

Pandas DataFrame 示例
]