Pandas 是一个 Python 的数据分析库,它提供了高效、灵活的数据结构和数据分析工具。以下是一些关于 Pandas 的基本教程。

安装 Pandas

首先,你需要安装 Pandas 库。你可以通过以下命令进行安装:

pip install pandas

Pandas 基本操作

Pandas 提供了多种数据结构,其中最常用的是 DataFrame。下面是一个简单的 DataFrame 示例:

import pandas as pd

data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [28, 22, 34, 29],
        'City': ['New York', 'Paris', 'Berlin', 'London']}

df = pd.DataFrame(data)

print(df)

这将输出以下内容:

Name Age City
John 28 New York
Anna 22 Paris
Peter 34 Berlin
Linda 29 London

查看数据

你可以使用 head()tail() 等方法来查看 DataFrame 的部分数据。

print(df.head())  # 显示前五行
print(df.tail())  # 显示后五行

数据筛选

你可以使用布尔索引来筛选数据。

print(df[df['Age'] > 25])  # 筛选年龄大于 25 的记录

这将输出以下内容:

Name Age City
Peter 34 Berlin
Linda 29 London

数据排序

你可以使用 sort_values() 方法对数据进行排序。

print(df.sort_values(by='Age', ascending=False))  # 按年龄降序排序

这将输出以下内容:

Name Age City
Peter 34 Berlin
Linda 29 London
John 28 New York
Anna 22 Paris

数据统计

Pandas 提供了多种统计方法,例如 mean()sum()median() 等。

print(df['Age'].mean())  # 计算年龄的平均值

这将输出:

28.0

扩展阅读

更多 Pandas 教程,请访问本站 Pandas 教程页面


Pandas_Logo