Pandas 是 Python 中一个非常流行的数据分析库,它提供了强大的数据结构和数据分析工具。以下是 Pandas 指南的概述。
安装 Pandas
在您的 Python 环境中安装 Pandas 是开始使用它的第一步。
pip install pandas
基本使用
创建 DataFrame
DataFrame 是 Pandas 的核心数据结构,类似于 R 中的数据框或 Excel 中的表格。
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
print(df)
选择数据
您可以使用多种方式来选择 DataFrame 中的数据。
- 使用列名:
print(df['Name'])
- 使用列标签:
print(df.loc[:, 'Name'])
高级功能
数据清洗
Pandas 提供了许多数据清洗的工具,如填充缺失值、删除重复项等。
df.fillna(0, inplace=True)
df.drop_duplicates(inplace=True)
数据合并
Pandas 支持多种数据合并方式,如合并、连接、外连接等。
df2 = pd.DataFrame({'Name': ['David', 'Eve'], 'Age': [40, 45]})
result = pd.merge(df, df2, on='Name')
print(result)
数据分析
Pandas 提供了丰富的数据分析功能,如描述性统计、分组、聚合等。
print(df.describe())
print(df.groupby('City').mean())
扩展阅读
想了解更多关于 Pandas 的内容,请访问我们的 Pandas 教程。
图片展示
这里有一些关于 Pandas 的图片,可以帮助您更好地理解: