Pandas 是 Python 中一个强大的数据分析库,它提供了快速、灵活且富有表达力的数据结构,可以用于数据清洗、转换和分析。以下是一些 Pandas 教程的基础内容,帮助您开始学习 Pandas。
快速入门
安装 Pandas
pip install pandas
导入 Pandas
import pandas as pd
创建 DataFrame
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)
基本操作
选择数据
# 选择所有 Name 列的值
df['Name']
# 选择行
df.loc[1:2]
# 选择列
df[['Name', 'Age']]
数据清洗
- 删除重复数据
df.drop_duplicates()
- 删除缺失值
df.dropna()
数据转换
- 改变数据类型
df['Age'] = df['Age'].astype(int)
高级功能
合并数据
- 合并两个 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['B', 'D', 'E'], 'value': [5, 6, 7]})
result = pd.merge(df1, df2, on='key')
数据分组
df.groupby('Name')['Age'].sum()
数据透视表
df.pivot_table(values='Age', index='Name', columns='Gender', aggfunc='mean')
实用技巧
- 使用
.head()
查看前几行数据 - 使用
.tail()
查看最后几行数据 - 使用
.info()
查看数据概览
扩展阅读
想了解更多 Pandas 高级技巧?请访问我们的 Pandas 高级教程。
Pandas Logo