配置概述
监控配置用于定义系统指标采集、告警规则及可视化策略。以下是核心配置项:
- 指标采集:通过
/community/abc_compute_forum/project_b/docs/monitoring/metrics
配置采集器参数 - 告警阈值:在
alert.rules.yaml
中定义临界值(🚨 示例:CPU使用率 > 90% 触发告警) - 可视化面板:使用 Grafana 配置仪表盘(📊 链接:Grafana配置文档)
配置示例
# 示例配置片段
monitoring:
enabled: true
metrics:
interval: 30s
targets:
- "localhost:9090"
alerts:
- name: "high_cpu"
description: "CPU使用率过高"
expression: "avg by (instance) (cpu_usage_seconds_total{mode='idle'} < 0.1)"
for: 5m
labels:
severity: "critical"