Pandas 是 Python 中一个非常强大的数据处理库,它可以帮助我们轻松地进行数据清洗、分析以及可视化。以下是一些 Pandas 的基本使用方法。

安装 Pandas

在开始使用 Pandas 之前,我们首先需要安装 Pandas 库。你可以通过以下命令进行安装:

pip install pandas

创建 DataFrame

DataFrame 是 Pandas 中最常用的数据结构,它类似于表格,由行和列组成。以下是如何创建一个简单的 DataFrame:

import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John'],
        'Age': [20, 21, 19],
        'City': ['New York', 'London', 'Bangkok']}
df = pd.DataFrame(data)
print(df)

DataFrame 示例

选择数据

在 Pandas 中,我们可以使用多种方式来选择数据,以下是一些常用的方法:

  • 使用列名
  • 使用列的索引
  • 使用条件表达式

以下是一个使用列名的示例:

print(df['Name'])

数据清洗

数据清洗是数据分析中非常重要的一步,Pandas 提供了多种方法来帮助我们清洗数据:

  • 去除重复数据
  • 填充缺失值
  • 删除特定行或列

以下是一个去除重复数据的示例:

df.drop_duplicates(inplace=True)

数据分析

Pandas 提供了丰富的数据分析功能,以下是一些常用的数据分析方法:

  • 数据排序
  • 数据分组
  • 数据聚合

以下是一个数据排序的示例:

df.sort_values(by='Age', inplace=True)

扩展阅读

更多 Pandas 教程,请访问我们的 Pandas 教程页面

返回首页