Pandas 是 Python 中一个强大的数据分析库,它提供了高效、灵活的数据结构和数据分析工具。以下是一些 Pandas 基础教程,帮助您快速入门。

安装 Pandas

在开始之前,请确保您已经安装了 Pandas。您可以使用以下命令进行安装:

pip install pandas

数据结构

Pandas 提供了两种主要的数据结构:SeriesDataFrame

  • Series 是一个一维数组,类似于 Python 中的列表。
  • DataFrame 是一个二维表格,类似于 Excel 或 CSV 文件。

Series 示例

import pandas as pd

# 创建一个 Series
s = pd.Series([1, 2, 3, 4, 5])

# 打印 Series
print(s)

DataFrame 示例

import pandas as pd

# 创建一个 DataFrame
data = {
    'Name': ['Tom', 'Nick', 'John'],
    'Age': [20, 21, 19]
}

df = pd.DataFrame(data)

# 打印 DataFrame
print(df)

数据操作

Pandas 提供了丰富的数据操作功能,包括数据选择、数据排序、数据过滤等。

数据选择

# 选择 DataFrame 中的某列
print(df['Name'])

# 选择 DataFrame 中的多列
print(df[['Name', 'Age']])

数据排序

# 按年龄排序
print(df.sort_values(by='Age'))

数据过滤

# 过滤年龄大于 20 的数据
print(df[df['Age'] > 20])

高级功能

Pandas 还提供了许多高级功能,例如数据合并、数据分组、数据透视表等。

数据合并

import pandas as pd

# 创建两个 DataFrame
df1 = pd.DataFrame({'Name': ['Tom', 'Nick'], 'Age': [20, 21]})
df2 = pd.DataFrame({'Name': ['Tom', 'John'], 'City': ['New York', 'London']})

# 按名称合并两个 DataFrame
result = pd.merge(df1, df2, on='Name')
print(result)

数据分组

# 按年龄分组
print(df.groupby('Age').mean())

数据透视表

# 创建数据透视表
print(df.pivot_table(values='Age', index='Name', columns='City'))

扩展阅读

如果您想了解更多关于 Pandas 的内容,请访问以下链接:

希望这些教程能帮助您快速入门 Pandas!🎉

图片

Pandas 图表

Pandas_Chart