Pandas 是 Python 中一个强大的数据分析库,它可以快速、灵活、有效地处理和分析数据。以下是一些 Pandas 的基本概念和操作。

快速开始

  1. 安装 Pandas: 如果您还没有安装 Pandas,可以使用以下命令进行安装:

    pip install pandas
    
  2. 导入 Pandas: 在 Python 脚本中导入 Pandas 库:

    import pandas as pd
    
  3. 创建 DataFrame: DataFrame 是 Pandas 的核心数据结构,类似于 Excel 中的表格。

    data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
    df = pd.DataFrame(data)
    

数据操作

  • 选择列: 使用列名来选择单个列:
    df['Name']
    
  • 选择行: 使用 .loc.iloc 来选择行:
    df.loc[0:2, 'Name']
    
  • 条件筛选: 使用布尔索引来筛选数据:
    df[df['Age'] > 20]
    

排序和分组

  • 排序: 使用 sort_values 方法对 DataFrame 进行排序:
    df.sort_values(by='Age', ascending=False)
    
  • 分组: 使用 groupby 方法对 DataFrame 进行分组:
    df.groupby('Name').mean()
    

数据可视化

Pandas 可以与 Matplotlib 和 Seaborn 等库结合使用进行数据可视化。

  • 基本图表: 使用 Matplotlib 绘制基本图表:
    import matplotlib.pyplot as plt
    df.plot(kind='bar')
    plt.show()
    

扩展阅读

更多 Pandas 教程和资源,请访问我们的 Pandas 教程页面

Pandas Logo