Pandas 是 Python 中一个非常强大的数据处理库,它可以帮助我们轻松地处理和分析数据。以下是一些关于 Pandas 的基础教程。

快速入门

安装 Pandas

首先,你需要安装 Pandas 库。你可以通过以下命令来安装:

pip install pandas

创建 DataFrame

DataFrame 是 Pandas 中的一个主要数据结构,它类似于表格。以下是一个简单的示例:

import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John'],
        'Age': [20, 21, 19],
        'City': ['New York', 'London', 'Paris']}

df = pd.DataFrame(data)

print(df)

这将创建一个包含三个列(Name, Age, City)和三行数据的 DataFrame。

数据筛选

你可以使用 .loc.iloc 来筛选 DataFrame 中的特定数据。

# 使用 .loc
print(df.loc[df['Age'] > 20])

# 使用 .iloc
print(df.iloc[1:3])

高级功能

合并数据

Pandas 提供了多种合并数据的方法,如 mergejoinconcat

# 使用 merge
df1 = pd.DataFrame({'Key': ['A', 'B', 'C', 'D'],
                    'Value': [1, 2, 3, 4]})

df2 = pd.DataFrame({'Key': ['B', 'D', 'E', 'F'],
                    'Value': [5, 6, 7, 8]})

result = pd.merge(df1, df2, on='Key')

print(result)

数据可视化

你可以使用 Pandas 与其他库(如 Matplotlib)来创建数据可视化。

import matplotlib.pyplot as plt

df['Age'].plot(kind='hist')
plt.show()

扩展阅读

更多关于 Pandas 的内容,可以参考我们的 Pandas 进阶教程


Pandas 图标