Pandas 是一个强大的数据分析工具,用于 Python 编程。它提供了数据结构化、数据分析以及数据操作的功能。以下是 Pandas 的基本教程。

安装 Pandas

首先,您需要安装 Pandas 库。您可以使用以下命令进行安装:

pip install pandas

Pandas 数据结构

Pandas 主要提供两种数据结构:SeriesDataFrame

Series

Series 是一种类似于数组的结构,它是一维的。以下是 Series 的基本使用方法:

import pandas as pd

# 创建一个 Series
s = pd.Series([1, 2, 3, 4, 5])

# 打印 Series
print(s)

DataFrame

DataFrame 是 Pandas 的核心数据结构,它类似于表格,具有行和列。以下是 DataFrame 的基本使用方法:

import pandas as pd

# 创建一个 DataFrame
data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19]
}
df = pd.DataFrame(data)

# 打印 DataFrame
print(df)

数据操作

Pandas 提供了丰富的数据操作功能,包括数据选择、数据排序、数据过滤等。

数据选择

# 选择特定列
print(df['Name'])

# 选择特定行
print(df.loc[1])

数据排序

# 按年龄排序
print(df.sort_values(by='Age'))

数据过滤

# 过滤年龄大于 20 的数据
print(df[df['Age'] > 20])

高级功能

Pandas 还提供了许多高级功能,如时间序列分析、文本分析等。

时间序列分析

import pandas as pd

# 创建一个时间序列
date_rng = pd.date_range(start='1/1/2020', end='1/10/2020', freq='D')
time_series = pd.Series(np.random.randn(len(date_rng)), index=date_rng)

# 打印时间序列
print(time_series)

文本分析

import pandas as pd

# 创建一个包含文本的 DataFrame
text_df = pd.DataFrame({'Text': ['This is a sample text.', 'Another text here.']})

# 分词
words = text_df['Text'].str.split()

# 打印分词结果
print(words)

扩展阅读

更多 Pandas 教程和示例,请访问我们的 Pandas 教程页面

图片展示

Python Pandas 简介

Python Pandas 简介

Pandas DataFrame 示例

Pandas DataFrame 示例

Pandas 时间序列分析

Pandas 时间序列分析

Pandas 文本分析

Pandas 文本分析