Pandas 是 Python 中一个非常强大的数据分析库,它提供了快速、灵活和直观的数据结构。以下是一些 Pandas 的基本概念和操作。

快速开始

  • 安装 Pandas: 首先,确保你已经安装了 Pandas。如果没有,可以通过以下命令进行安装:
    pip install pandas
    
  • 导入 Pandas: 在 Python 脚本中,你需要导入 Pandas 库:
    import pandas as pd
    

基本概念

  • Series: 类似于一维数组,可以包含任何数据类型。
  • DataFrame: 类似于表格,可以包含多列数据。

示例

假设我们有一个 CSV 文件 data.csv,包含以下数据:

name age city
Alice 28 New York
Bob 32 Los Angeles
Carol 24 Chicago

使用 Pandas 读取这个文件:

df = pd.read_csv('data.csv')

现在,df 就是一个 DataFrame,你可以通过列名访问数据:

print(df['name'])

高级操作

  • 筛选数据: 可以使用 .loc.iloc 来筛选数据。
  • 数据排序: 使用 .sort_values() 方法可以对数据进行排序。
  • 数据分组: 使用 .groupby() 方法可以对数据进行分组。

更多资源

想要深入学习 Pandas,可以访问以下链接:

返回首页