引言
线上环境新上了几个服务,需要监控它相应的指标,这边使用 Prometheus-Operator 的 ServiceMonitor 实现。
马上开动。
开始
直接上它的 YAML 文件:
部署:
部署完成后,这边没有数据:
图片
开始排查。
排查
详细检查了我的 ServiceMonitor YAML 文件是否有问题,发现没有问题,奇怪了,
想了半天,我想不应该是 RBAC 之类的,但是没办法了,只能去看看 Prometheus 的 Logs 了。
没想到问题真出在这里:
图片
这里有添加了相应资源和 Verb:
以下是完整的 YAML 文件:
重新部署下 Prometheus-Operator:
依次等待全部启动完成。
再次查看:
图片
最好再用 PromQL 查看下:
图片