Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活、直观的数据结构,用于数据分析。以下是一些 Pandas 的基本概念和用法。

安装 Pandas

首先,确保你已经安装了 Pandas。如果没有,可以通过以下命令进行安装:

pip install pandas

Pandas 数据结构

Pandas 提供了两种主要的数据结构:SeriesDataFrame

  • Series 是一个一维数组,类似于 Python 中的列表。
  • DataFrame 是一个二维表格数据结构,类似于 Excel 或 SQL 表。

Series 示例

import pandas as pd

s = pd.Series([1, 2, 3, 4, 5])
print(s)

DataFrame 示例

import pandas as pd

data = {
    'Name': ['Tom', 'Nick', 'John', 'Alice'],
    'Age': [20, 21, 19, 18]
}

df = pd.DataFrame(data)
print(df)

Pandas 操作

Pandas 提供了丰富的操作,包括数据清洗、数据转换、数据分析等。

数据清洗

# 删除缺失值
df.dropna(inplace=True)

# 删除重复值
df.drop_duplicates(inplace=True)

数据转换

# 转换数据类型
df['Age'] = df['Age'].astype(int)

数据分析

# 计算平均值
print(df['Age'].mean())

# 统计描述
print(df.describe())

扩展阅读

想要了解更多关于 Pandas 的知识,可以访问我们的 Pandas 教程


Pandas Logo