
## 数据清洗:去除噪声和异常值,确保数据质量
- 删除重复记录
- 处理缺失值(如填充或删除)
- 标准化/归一化数值范围
- 转换非结构化数据
点击查看完整数据清洗教程

## 特征缩放:统一数据尺度,提升模型效果
- 最大最小值归一化(Min-Max Scaling)
- 标准化(Z-Score Normalization)
- 基于分位数的缩放
- 自动化工具推荐:[Scikit-Learn](https://scikit-learn.org/stable/modules/preprocessing.html)

## 缺失值处理:保持数据完整性
- 用平均值/中位数填充
- 使用插值法
- 删除缺失率高的特征
- 高级方法:[多重插补技术](/community/machine_learning/multiple_imputation)
了解更多预处理技巧