Pandas 是 Python 中一个非常流行的数据分析库,它提供了强大的数据结构和数据分析工具。以下是 Pandas 指南的概述。

安装 Pandas

在您的 Python 环境中安装 Pandas 是开始使用它的第一步。

pip install pandas

基本使用

创建 DataFrame

DataFrame 是 Pandas 的核心数据结构,类似于 R 中的数据框或 Excel 中的表格。

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)
print(df)

选择数据

您可以使用多种方式来选择 DataFrame 中的数据。

  • 使用列名:
print(df['Name'])
  • 使用列标签:
print(df.loc[:, 'Name'])

高级功能

数据清洗

Pandas 提供了许多数据清洗的工具,如填充缺失值、删除重复项等。

df.fillna(0, inplace=True)
df.drop_duplicates(inplace=True)

数据合并

Pandas 支持多种数据合并方式,如合并、连接、外连接等。

df2 = pd.DataFrame({'Name': ['David', 'Eve'], 'Age': [40, 45]})
result = pd.merge(df, df2, on='Name')
print(result)

数据分析

Pandas 提供了丰富的数据分析功能,如描述性统计、分组、聚合等。

print(df.describe())
print(df.groupby('City').mean())

扩展阅读

想了解更多关于 Pandas 的内容,请访问我们的 Pandas 教程

图片展示

这里有一些关于 Pandas 的图片,可以帮助您更好地理解:

Pandas Symbol
Python Pandas DataFrame