Pandas 是一个强大的数据分析工具,它可以帮助你高效地处理和分析数据。以下是一些关于 Pandas 的基础教程,帮助你快速上手。

快速入门

  1. 安装 Pandas
    在开始之前,确保你已经安装了 Pandas。可以使用以下命令进行安装:

    pip install pandas
    
  2. 导入 Pandas
    在 Python 中导入 Pandas:

    import pandas as pd
    
  3. 创建 DataFrame
    DataFrame 是 Pandas 中的主要数据结构,类似于 Excel 表格。以下是一个简单的例子:

    data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
    df = pd.DataFrame(data)
    

常用操作

  1. 查看数据
    使用 head()tail()info() 方法可以查看 DataFrame 的部分数据、末尾数据和基本统计信息。

    df.head()
    df.tail()
    df.info()
    
  2. 数据筛选
    使用布尔索引或条件表达式可以筛选数据。

    df[df['Age'] > 20]
    
  3. 数据排序
    使用 sort_values() 方法可以按照某个列进行排序。

    df.sort_values(by='Age', ascending=False)
    
  4. 数据合并
    Pandas 提供了多种数据合并方法,如 merge()join()concat()

    df1 = pd.DataFrame({'Name': ['Tom', 'Nick'], 'Age': [20, 21]})
    df2 = pd.DataFrame({'Name': ['Tom', 'John'], 'City': ['New York', 'Los Angeles']})
    result = pd.merge(df1, df2, on='Name')
    

扩展阅读

想要更深入地了解 Pandas,可以参考以下教程:

图片展示

Pandas 图标