Pandas 是 Python 中一个强大的数据分析库,它提供了数据结构 DataFrame 和一系列数据分析工具。本教程将为您介绍 Pandas 的基本使用方法。

安装 Pandas

在开始之前,请确保您已经安装了 Pandas。您可以使用以下命令进行安装:

pip install pandas

DataFrame 基础

DataFrame 是 Pandas 的核心数据结构,类似于 Excel 表格或 SQL 表。以下是一个简单的 DataFrame 示例:

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

print(df)

输出结果:

Name Age City
Alice 25 New York
Bob 30 Los Angeles
Charlie 35 Chicago

数据操作

Pandas 提供了丰富的数据操作功能,包括选择、过滤、排序等。

选择数据

# 选择所有 Age 大于 30 的数据
df_filtered = df[df['Age'] > 30]

print(df_filtered)

输出结果:

Name Age City
Bob 30 Los Angeles
Charlie 35 Chicago

过滤数据

# 过滤出 City 为 'New York' 的数据
df_filtered = df[df['City'] == 'New York']

print(df_filtered)

输出结果:

Name Age City
Alice 25 New York

数据可视化

Pandas 可以与 Matplotlib、Seaborn 等库结合进行数据可视化。

import matplotlib.pyplot as plt

df.plot(kind='bar', x='Name', y='Age')
plt.show()

Pandas 数据可视化

扩展阅读

如果您想了解更多关于 Pandas 的知识,可以访问以下链接:

希望这个教程对您有所帮助!👍