Pandas 是一个强大的数据分析工具,它提供了快速、灵活、直观的数据结构,用于数据分析。以下是一些 Pandas 的基本教程。

安装 Pandas

首先,确保你已经安装了 Pandas。你可以使用以下命令来安装:

pip install pandas

基本操作

创建 DataFrame

DataFrame 是 Pandas 的核心数据结构,类似于表格。

import pandas as pd

data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19]
}

df = pd.DataFrame(data)

选择数据

你可以使用 .loc.iloc 来选择 DataFrame 中的数据。

# 使用 .loc
print(df.loc[0:2, 'Name'])

# 使用 .iloc
print(df.iloc[0:2, 0])

数据清洗

数据清洗是数据分析的重要步骤。

# 删除缺失值
df.dropna(inplace=True)

# 删除重复值
df.drop_duplicates(inplace=True)

高级操作

合并数据

Pandas 提供了多种合并数据的方法,如 mergejoinconcat

df1 = pd.DataFrame({'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]})
df2 = pd.DataFrame({'Name': ['Tom', 'Nick', 'John'], 'City': ['New York', 'London', 'Paris']})

# 使用 merge
print(pd.merge(df1, df2, on='Name'))

# 使用 join
print(df1.join(df2))

# 使用 concat
print(pd.concat([df1, df2]))

数据可视化

Pandas 可以与 Matplotlib 或 Seaborn 等库结合使用来进行数据可视化。

import matplotlib.pyplot as plt

df.plot(kind='line')
plt.show()

扩展阅读

更多 Pandas 教程,请访问 Pandas 教程

[center]https://cloud-image.ullrai.com/q/Pandas/[/center]