Pandas 是 Python 中用于数据分析的强大库。它提供了丰富的数据结构,使得数据处理和分析变得更加简单和高效。

快速入门

  1. 数据结构

    • Series:类似于一个一维数组或列。
    • DataFrame:类似于表格,具有行和列,可以看作是 Series 的容器。
  2. 基本操作

    • 选择数据:使用 .loc[].iloc[]
    • 数据排序:使用 .sort_values()
    • 数据过滤:使用布尔索引。
  3. 数据处理

    • 数据清洗:处理缺失值、重复值等。
    • 数据合并:使用 .merge().join()
    • 数据转换:使用 .apply().map()

实践示例

下面是一个简单的示例,展示了如何使用 Pandas 进行数据分析:

import pandas as pd

# 创建一个 DataFrame
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)

# 打印 DataFrame
print(df)

输出结果:

   Name  Age
0   Tom   20
1  Nick   21
2  John   19

扩展阅读

想了解更多关于 Pandas 的知识,可以阅读以下文章:

Pandas 图标