Pandas 是一个强大的数据分析工具,它提供了快速、灵活、直观的数据结构,以及高效的数据操作功能。以下是一些 Pandas 的基本概念和使用方法。

快速开始

安装 Pandas

首先,确保你已经安装了 Pandas。可以通过以下命令安装:

pip install pandas

导入 Pandas

在 Python 中,使用以下命令导入 Pandas:

import pandas as pd

创建 DataFrame

DataFrame 是 Pandas 中的主要数据结构,类似于表格。

data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

数据操作

查看数据

使用 head() 方法可以查看 DataFrame 的前几行:

print(df.head())

数据筛选

你可以使用布尔索引来筛选数据。

print(df[df['Age'] > 20])

数据排序

使用 sort_values() 方法可以对数据进行排序:

print(df.sort_values(by='Age', ascending=False))

高级功能

数据合并

Pandas 提供了多种数据合并方法,如 merge(), join()concat()

df2 = pd.DataFrame({'Name': ['Tom', 'Nick'], 'Score': [85, 90]})

print(pd.merge(df, df2, on='Name'))

数据分组

使用 groupby() 方法可以对数据进行分组。

print(df.groupby('City')['Age'].mean())

扩展阅读

想了解更多关于 Pandas 的知识?请访问我们的 Pandas 教程


Data Science