量化指标是评估模型压缩效果的核心工具,以下为常见分类与推荐资源:

1. 基础量化指标 📊

  • Accuracy:压缩后模型在测试集上的准确率
  • FLOPs:计算操作量(Floating Point Operations),反映模型复杂度
  • Model_Size:参数量或存储需求(如MB/GB)
  • Latency:推理延时(ms级别)

2. 高级评估维度 🔍

  • Precision:量化后数值的精度保持程度
  • Dynamic_Range:激活值的动态范围压缩效果
  • Energy_Efficiency:能效比(适用于嵌入式部署)

3. 推荐工具与框架 🛠️

Quantization_Metrics

4. 扩展阅读 📚

如需具体指标实现案例,可参考 量化实践教程 进行深入学习。