Pandas 是 Python 中一个非常流行的数据分析库,它提供了强大的数据处理功能。本教程将带你入门 Pandas 数据分析。

安装 Pandas

在开始之前,请确保你已经安装了 Pandas。你可以使用以下命令安装:

pip install pandas

基础操作

创建 DataFrame

DataFrame 是 Pandas 中的基本数据结构,类似于表格。

import pandas as pd

data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

查看数据

你可以使用 head(), tail(), info()describe() 等方法查看数据。

print(df.head())
print(df.tail())
print(df.info())
print(df.describe())

数据筛选

你可以使用布尔索引来筛选数据。

print(df[df['Age'] > 20])

数据排序

你可以使用 sort_values() 方法来排序数据。

print(df.sort_values(by='Age', ascending=False))

高级操作

数据合并

Pandas 提供了多种数据合并方法,如 merge(), join(), concat() 等。

df2 = pd.DataFrame({
    'Name': ['Tom', 'Nick'],
    'City': ['New York', 'London']
})

print(pd.merge(df, df2, on='Name'))

数据分组

你可以使用 groupby() 方法对数据进行分组。

print(df.groupby('City').mean())

实例

假设你有一个包含用户数据的 DataFrame,你可以使用 Pandas 进行以下操作:

  • 统计不同年龄段的用户数量
  • 分析用户分布的城市
  • 查找年龄最大的用户

更多 Pandas 实例

总结

Pandas 是一个非常强大的数据分析工具,它可以帮助你快速完成数据处理和分析任务。希望这个教程能帮助你入门 Pandas 数据分析。

回到 Pandas 教程列表