Pandas 教程

Pandas 是 Python 中一个非常强大的数据处理库，它可以帮助我们轻松地进行数据清洗、分析以及可视化。以下是一些 Pandas 的基本使用方法。

安装 Pandas

在开始使用 Pandas 之前，我们首先需要安装 Pandas 库。你可以通过以下命令进行安装：

pip install pandas

创建 DataFrame

DataFrame 是 Pandas 中最常用的数据结构，它类似于表格，由行和列组成。以下是如何创建一个简单的 DataFrame：

import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John'],
        'Age': [20, 21, 19],
        'City': ['New York', 'London', 'Bangkok']}
df = pd.DataFrame(data)
print(df)

选择数据

在 Pandas 中，我们可以使用多种方式来选择数据，以下是一些常用的方法：

使用列名
使用列的索引
使用条件表达式

以下是一个使用列名的示例：

print(df['Name'])

数据清洗

数据清洗是数据分析中非常重要的一步，Pandas 提供了多种方法来帮助我们清洗数据：

去除重复数据
填充缺失值
删除特定行或列

以下是一个去除重复数据的示例：

df.drop_duplicates(inplace=True)

数据分析

Pandas 提供了丰富的数据分析功能，以下是一些常用的数据分析方法：

数据排序
数据分组
数据聚合

以下是一个数据排序的示例：

df.sort_values(by='Age', inplace=True)

扩展阅读

更多 Pandas 教程，请访问我们的 Pandas 教程页面。

返回首页