量化指标是评估模型压缩效果的核心工具,以下为常见分类与推荐资源:
1. 基础量化指标 📊
- Accuracy:压缩后模型在测试集上的准确率
- FLOPs:计算操作量(Floating Point Operations),反映模型复杂度
- Model_Size:参数量或存储需求(如MB/GB)
- Latency:推理延时(ms级别)
2. 高级评估维度 🔍
- Precision:量化后数值的精度保持程度
- Dynamic_Range:激活值的动态范围压缩效果
- Energy_Efficiency:能效比(适用于嵌入式部署)
3. 推荐工具与框架 🛠️
- PyTorch Quantization Toolkit
- TensorRT 的量化实现文档
- ONNX Runtime 支持的量化模式
4. 扩展阅读 📚
如需具体指标实现案例,可参考 量化实践教程 进行深入学习。