Prometheus 是 Kubernetes 生态中常用的监控工具,可实时采集集群指标📊。以下是关键步骤:

1. 安装 Prometheus

  • 使用 Helm 部署:helm install prometheus stable/prometheus
  • 或手动部署 YAML 文件(查看详细文档
  • 配置 Prometheus Server 以抓取 kubelet 指标📈

2. 配置监控

  • 修改 prometheus.yml 添加 Kubernetes 相关服务:
    scrape_configs:
      - job_name: 'k8s-nodes'
        static_configs:
          - targets: ['node1:10080', 'node2:10080']
    
  • 启用服务发现(了解如何配置
  • 配置 Alertmanager 发送告警🔔

3. 常用指标

  • 节点资源:node_memory_utilization_ratio
  • 容器状态:container_status_restarts_total
  • 集群健康:apiserver_requests_total

📘 提示:建议结合 Grafana 可视化监控数据,访问 Grafana 配置指南 获取更多帮助

Prometheus icon

Kubernetes dashboard