Prometheus 是 Kubernetes 生态中常用的监控工具,可实时采集集群指标📊。以下是关键步骤:
1. 安装 Prometheus
- 使用 Helm 部署:
helm install prometheus stable/prometheus
- 或手动部署 YAML 文件(查看详细文档)
- 配置 Prometheus Server 以抓取 kubelet 指标📈
2. 配置监控
- 修改
prometheus.yml
添加 Kubernetes 相关服务:scrape_configs: - job_name: 'k8s-nodes' static_configs: - targets: ['node1:10080', 'node2:10080']
- 启用服务发现(了解如何配置)
- 配置 Alertmanager 发送告警🔔
3. 常用指标
- 节点资源:
node_memory_utilization_ratio
- 容器状态:
container_status_restarts_total
- 集群健康:
apiserver_requests_total
📘 提示:建议结合 Grafana 可视化监控数据,访问 Grafana 配置指南 获取更多帮助
Prometheus icon
Kubernetes dashboard