Pandas 是一个强大的数据分析工具,它提供了快速、灵活和直观的数据结构,使得数据分析和处理变得更加容易。以下是一些关于 Pandas 的基本概念和技巧。

安装 Pandas

首先,您需要安装 Pandas 库。您可以使用以下命令进行安装:

pip install pandas

Pandas 数据结构

Pandas 提供了两种主要的数据结构:SeriesDataFrame

  • Series 是一个一维数组,类似于 Python 中的列表或 NumPy 中的数组。
  • DataFrame 是一个二维表格,类似于 Excel 或 SQL 数据库中的表格。

Series 示例

import pandas as pd

# 创建一个 Series
s = pd.Series([1, 2, 3, 4, 5])

# 打印 Series
print(s)

DataFrame 示例

import pandas as pd

# 创建一个 DataFrame
data = {'Name': ['Tom', 'Nick', 'John', 'Alice'],
        'Age': [20, 21, 19, 18],
        'City': ['New York', 'London', 'Sydney', 'Tokyo']}

df = pd.DataFrame(data)

# 打印 DataFrame
print(df)

Pandas 操作

Pandas 提供了丰富的操作,包括数据清洗、数据转换、数据聚合等。

数据清洗

# 删除缺失值
df.dropna(inplace=True)

# 填充缺失值
df.fillna(0, inplace=True)

数据转换

# 转换数据类型
df['Age'] = df['Age'].astype(int)

数据聚合

# 计算平均值
mean_age = df['Age'].mean()
print(mean_age)

扩展阅读

如果您想了解更多关于 Pandas 的内容,请访问我们的官方文档.

Pandas Logo