Pandas 是 Python 中一个非常流行的数据分析库,它提供了强大的数据结构和数据分析工具。以下是一些 Pandas 的基础教程。

安装 Pandas

首先,确保你已经安装了 Python。然后,可以使用 pip 来安装 Pandas:

pip install pandas

基础操作

创建 DataFrame

DataFrame 是 Pandas 的核心数据结构,类似于 R 中的数据框或 SQL 中的表。

import pandas as pd

data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

选择数据

你可以使用 .loc.iloc 来选择 DataFrame 中的数据。

# 通过标签选择
print(df.loc[0, 'Name'])

# 通过整数位置选择
print(df.iloc[1, 1])

数据清洗

在数据分析中,数据清洗是一个非常重要的步骤。

# 删除缺失值
df.dropna(inplace=True)

# 删除重复行
df.drop_duplicates(inplace=True)

数据可视化

Pandas 可以与 Matplotlib 或 Seaborn 等库一起使用来进行数据可视化。

import matplotlib.pyplot as plt
import seaborn as sns

sns.lineplot(data=df, x='Age', y='City')
plt.show()

扩展阅读

想要了解更多关于 Pandas 的内容,可以访问我们的 Pandas 教程页面

图片示例

Pandas DataFrame 示例

DataFrame_example

数据可视化

Data_Visualization_example