Alertmanager 是 Prometheus 生态中用于管理告警的核心组件,其静默功能(Silences)允许用户暂时屏蔽特定告警。以下是使用指南:


📌 什么是静默?

静默功能通过 抑制规则 暂时隐藏告警,常用于:

  • 假警过滤(如网络波动)
  • 业务维护期间的告警屏蔽
  • 节假日/非工作时间的告警静默
alertmanager_silence

🛠 配置静默的三种方式

  1. Web UI 静默

  2. API 接口

    • 使用 POST /api/v1/silences 接口动态添加静默
    • 示例请求:
      {
        "matchers": [{"name": "job", "value": "node_exporter", "isRegex": true}]
      }
      
  3. 配置文件

    • alertmanager.yml 中定义静态静默规则
    • 示例片段:
      silences:
        - name: "maintenance-silence"
          matchers:
            - name: "cluster"
              value: "prod"
          duration: 1h
      

⚠️ 静默的最佳实践

  • 避免长期使用:建议静默时长控制在 1-2 小时内
  • 精准匹配:通过标签组合减少误屏蔽风险
  • 定时任务:可结合 cron 实现周期性静默
    silence_cron

了解更多请访问 Alertmanager 官方文档