Pandas是Python中处理数据的核心库,掌握其基础操作能显著提升数据处理效率。以下是常用功能示例:
1. 创建数据框 📁
使用pd.DataFrame()
构建结构化数据:
import pandas as pd
data = {'姓名': ['张三', '李四'], '年龄': [25, 30]}
df = pd.DataFrame(data)
2. 数据清洗 🧹
处理缺失值、重复数据等:
df.dropna()
:删除空值df.fillna(0)
:填充空值df.drop_duplicates()
:去除重复行
3. 数据筛选 🔍
通过条件过滤数据:
df[df['年龄'] > 28]
4. 数据排序 🔄
按列排序:
df.sort_values(by='年龄', ascending=False)
5. 数据合并 🧩
使用concat()
或merge()
整合数据集:
pd.concat([df1, df2], axis=0)
6. 数据统计 📈
快速获取汇总信息:
df.describe()
:统计描述df.mean()
:平均值计算