Pandas 是一个强大的数据分析工具,它提供了快速、灵活且易于使用的数据结构,非常适合进行数据分析。以下是 Pandas 的基础入门指南。

安装 Pandas

首先,您需要安装 Pandas。您可以使用以下命令进行安装:

pip install pandas

基础概念

数据帧(DataFrame)

数据帧是 Pandas 中最核心的数据结构,它类似于一个表格,包含行和列。每个单元格可以存储不同的数据类型。

索引(Index)

索引是数据帧中的一个特殊列,用于标识数据帧中的行和列。

快速开始

创建数据帧

import pandas as pd

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

查看数据帧

print(df)

选择数据

print(df['Name'])  # 选择 'Name' 列
print(df[['Name', 'City']])  # 选择多列
print(df.iloc[1:3])  # 选择行

数据处理

df['Age'] = df['Age'] + 1  # 修改数据
df['New Column'] = df['Name'].apply(lambda x: len(x))  # 添加新列

扩展阅读

想要了解更多关于 Pandas 的知识,可以访问我们的 Pandas 官方文档

Pandas Logo