在 Kubernetes 集群中,监控是确保服务稳定运行的关键。Prometheus 和 Grafana 是两个强大的工具,用于收集、存储和可视化监控数据。以下是一个简单的 Prometheus 和 Grafana 教程,帮助您入门。
安装 Prometheus
首先,您需要在您的 Kubernetes 集群中安装 Prometheus。您可以通过以下命令进行安装:
kubectl apply -f prometheus.yml
这里假设您已经有一个名为 prometheus.yml
的配置文件。
配置 Prometheus
Prometheus 的配置文件通常位于 /etc/prometheus/prometheus.yml
。以下是一个简单的配置示例:
global:
scrape_interval: 15s
scrape_configs:
- job_name: 'kubernetes-apiservers'
kubernetes_sd_configs:
- role: pod
namespaces: ['monitoring']
这个配置会从 Kubernetes API 服务器收集监控数据。
安装 Grafana
接下来,您需要在 Kubernetes 集群中安装 Grafana。以下是一个简单的安装命令:
helm install grafana grafana/grafana
安装完成后,您可以通过以下命令访问 Grafana:
kubectl port-forward svc/grafana 3000:3000
现在,您可以在浏览器中访问 http://localhost:3000
并使用默认用户 admin
登录。
配置 Grafana
在 Grafana 中,您需要创建一个新的数据源并选择 Prometheus。然后,您可以创建仪表板来可视化您的监控数据。
示例仪表板
以下是一个简单的 Prometheus 和 Grafana 仪表板示例:
title: 'Kubernetes Node Metrics'
timezone: 'browser'
panels:
- type: 'graph'
title: 'Node CPU Usage'
datasource: 'prometheus'
fieldOptions:
graphTransform: 'sum'
targets:
- expr: 'sum(kube_node_cpu_usage_seconds_total{mode="total"}) by (node)'
这个仪表板会显示所有节点的 CPU 使用率。
扩展阅读
如果您想了解更多关于 Prometheus 和 Grafana 的信息,请访问我们的 Prometheus 教程 和 Grafana 教程。