Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活、直观的数据结构,用于数据分析。以下是一些 Pandas 的基本概念和用法。
安装 Pandas
首先,确保你已经安装了 Pandas。如果没有,可以通过以下命令进行安装:
pip install pandas
Pandas 数据结构
Pandas 提供了两种主要的数据结构:Series 和 DataFrame。
- Series 是一个一维数组,类似于 Python 中的列表。
- DataFrame 是一个二维表格数据结构,类似于 Excel 或 SQL 表。
Series 示例
import pandas as pd
s = pd.Series([1, 2, 3, 4, 5])
print(s)
DataFrame 示例
import pandas as pd
data = {
'Name': ['Tom', 'Nick', 'John', 'Alice'],
'Age': [20, 21, 19, 18]
}
df = pd.DataFrame(data)
print(df)
Pandas 操作
Pandas 提供了丰富的操作,包括数据清洗、数据转换、数据分析等。
数据清洗
# 删除缺失值
df.dropna(inplace=True)
# 删除重复值
df.drop_duplicates(inplace=True)
数据转换
# 转换数据类型
df['Age'] = df['Age'].astype(int)
数据分析
# 计算平均值
print(df['Age'].mean())
# 统计描述
print(df.describe())
扩展阅读
想要了解更多关于 Pandas 的知识,可以访问我们的 Pandas 教程。
Pandas Logo