Pandas 是一个强大的数据分析库,它提供了快速、灵活和直观的数据结构。以下是一些关于 Pandas 的基础知识和技巧。

快速开始

安装 Pandas

首先,您需要安装 Pandas。您可以通过以下命令进行安装:

pip install pandas

创建 DataFrame

DataFrame 是 Pandas 的核心数据结构。以下是一个简单的例子:

import pandas as pd

data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

选择和筛选数据

您可以使用 .loc.iloc 来选择和筛选数据:

# 通过标签选择
df.loc[df['Age'] > 20]

# 通过位置选择
df.iloc[1:3, :]

高级功能

合并和连接

Pandas 提供了多种合并和连接数据的方法:

  • merge()
  • join()
  • concat()

数据清洗

数据清洗是数据分析的重要步骤。以下是一些常用的数据清洗方法:

  • 删除缺失值:dropna()
  • 填充缺失值:fillna()
  • 删除重复值:drop_duplicates()

学习资源

如果您想深入学习 Pandas,以下是一些推荐的资源:

Pandas Logo