Pandas 是一个强大的数据分析工具,它可以帮助你高效地进行数据处理和分析。以下是一些 Pandas 的基础知识,适合初学者入门。

安装与导入

首先,确保你已经安装了 Pandas。如果没有安装,可以通过以下命令进行安装:

pip install pandas

安装完成后,在 Python 中导入 Pandas:

import pandas as pd

基础操作

创建 DataFrame

DataFrame 是 Pandas 的核心数据结构,类似于 Excel 表格。

data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)

选择数据

你可以使用列名来选择特定的列:

print(df['Name'])

数据筛选

使用布尔索引来筛选数据:

print(df[df['Age'] > 28])

高级操作

合并数据

你可以使用 merge 函数来合并两个 DataFrame:

df1 = pd.DataFrame({'Name': ['Alice', 'Bob'], 'Age': [25, 30]})
df2 = pd.DataFrame({'Name': ['Alice', 'Bob'], 'City': ['New York', 'Los Angeles']})

merged_df = pd.merge(df1, df2, on='Name')

数据透视表

数据透视表可以用来汇总和展示数据:

pivot_table = df.pivot_table(values='Age', index='City', aggfunc='mean')

图片示例

这里是一个 Pandas DataFrame 的示例:

DataFrame 示例

扩展阅读

想要了解更多关于 Pandas 的知识,可以访问我们的 Pandas 进阶教程