Pandas是Python中处理数据的核心库,掌握其基础操作能显著提升数据处理效率。以下是常用功能示例:

1. 创建数据框 📁

使用pd.DataFrame()构建结构化数据:

import pandas as pd
data = {'姓名': ['张三', '李四'], '年龄': [25, 30]}
df = pd.DataFrame(data)
数据框

2. 数据清洗 🧹

处理缺失值、重复数据等:

  • df.dropna():删除空值
  • df.fillna(0):填充空值
  • df.drop_duplicates():去除重复行
数据清洗
[点击扩展数据清洗教程](/community/resources/tutorials/pandas/data_cleaning)

3. 数据筛选 🔍

通过条件过滤数据:

df[df['年龄'] > 28]
数据筛选

4. 数据排序 🔄

按列排序:

df.sort_values(by='年龄', ascending=False)
数据排序

5. 数据合并 🧩

使用concat()merge()整合数据集:

pd.concat([df1, df2], axis=0)
数据合并

6. 数据统计 📈

快速获取汇总信息:

  • df.describe():统计描述
  • df.mean():平均值计算
数据统计

了解更多高级操作