Pandas 是 Python 中一个强大的数据分析库,常用于数据清洗、转换和分析。以下是一些 Pandas 的基本概念和使用方法。

安装 Pandas

首先,确保你已经安装了 Pandas。如果没有安装,可以通过以下命令进行安装:

pip install pandas

基本操作

数据结构

Pandas 提供了两种主要的数据结构:SeriesDataFrame

  • Series 是一维的数组结构,类似于 Python 中的列表。
  • DataFrame 是二维的表格结构,类似于 Excel 或 SQL 数据表。

数据读取

你可以使用 pandas.read_csv() 函数来读取 CSV 文件。

import pandas as pd

data = pd.read_csv('data.csv')

数据清洗

数据清洗是数据分析的重要步骤。以下是一些常用的数据清洗方法:

  • 删除重复数据:data.drop_duplicates()
  • 删除缺失值:data.dropna()
  • 填充缺失值:data.fillna()

数据转换

Pandas 提供了丰富的数据转换功能,例如:

  • 转换数据类型:data['column'].astype(type)
  • 排序:data.sort_values(by='column')
  • 筛选数据:data[data['column'] > value]

实例

以下是一个简单的 Pandas 实例:

import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)

print(df)

输出:

  Name  Age
0  Tom   20
1 Nick   21
2  John  19

扩展阅读

想要了解更多关于 Pandas 的知识,可以访问我们的 Pandas 教程 页面。