数据集的质量直接影响模型性能,以下是关键要素:

  • 准确性
    确保数据真实可靠,避免错误信息。

    数据准确性
  • 完整性 📦
    检查数据是否全面,无缺失字段。

    数据完整性
  • 一致性 🔄
    保持数据格式和标准统一,减少矛盾。

    数据一致性
  • 时效性
    数据应更新及时,反映最新情况。

    数据时效性

需要进一步优化数据质量可参考: /dataset_overview