我们不用Prometheus了?

运维 系统运维
我们选择使用OpenTelemetry和VictoriaMetrics。那么这两者究竟是何方神圣呢?请允许我慢慢道来。考虑到我也是刚接触,所以今天先给大家介绍一下VictoriaMetrics。OpenTelemetry后续再做介绍。

[[441569]]

引言

上次说到我们不用docker,而是使用containerd作为CRI了。没想到,连监控告警这一块也换了。以前我们使用的prometheus进行监控数据的采集、存储和提供查询,alertmanager进行告警推送,同时使用了grafana做数据展示。那么现在呢,我们选择使用OpenTelemetry和VictoriaMetrics。那么这两者究竟是何方神圣呢?请允许我慢慢道来。考虑到我也是刚接触,所以今天先给大家介绍一下VictoriaMetrics。OpenTelemetry后续再做介绍。

注:后续VictoriaMetrics简称为vm

什么是VM

这里我们看官网的描述。如下:

  1. VictoriaMetrics is a fast, cost-effective and scalable monitoring solution  
  2. and time series database 

翻译过来就是说,vm是一个快速、实用和可扩展的监控方案和时序数据库。思考一下:prometheus也是时序数据库,两者会不会有什么不一样呢?

VM特性

要说vm的特性,可太多了。举几个例子:

  1. 可以作为prometheus长期存储的一个方案。我们知道prometheus默认只会保留最近15天的数据,如果要保留更长时间的数据,需要把数据写到远端存储中去
  2. 当使用grafana时,可以把其数据源prometheus可以被替换为vm,因为vm也支持prometheus查询APi
  3. 它实现了基于PromQL的查询语言,即MetricsQL,并且在PromQL基础上做了改进
  4. 在处理百万比别数据时,使用内存资源比Thanos、Promtheus更少
  5. ...

VM组件

那么vm有哪些组件呢,(cluster)架构又是怎么样的呢?

主要组件说明:

  • vmstorage负责存储时序数据以及提供查询
  • vmselect从vmstorage获取数据返回给查询数据的客户端,支持PromeQL
  • vminsert通过remote write API将数据存储到vmstorage

其他组件说明:

  • vmui提供了一个UI供查询数据和问题排查
  • vmalert用户告警
  • vmagent用户数据采集
  • vmbackup用于数据备份
  • vmrestore用于数据恢复
  • ...

VM安装注意事项

vm可以通过多种方式安装,如二进制、docker镜像以及源码。可根据场景进行选择。如果在k8s中进行安装,我们可以直接使用operator来进行安装。下面重点说一下安装过程中的一些注意事项。

一个最小的集群必须包含以下节点:

  • 一个vmstorage单节点,另外要指定-retentionPeriod和-storageDataPath两个参数
  • 一个vminsert单节点,要指定-storageNode=
  • 一个vmselect单节点,要指定-storageNode=

注:高可用情况下,建议每个服务至少有个两个节点

在vmselect和vminsert前面需要一个负载均衡,比如vmauth、nginx,同时要求:

  • 以/insert开头的请求必须要被路由到vminsert节点的8480端口
  • 以/select开头的请求必须要被路由到vmselect节点的8481端口

注:各服务的端口可以通过-httpListenAddr进行指定

建议为集群安装监控

如果是在一个主机上进行安装测试集群,vminsert、vmselect和vmstorage各自的-httpListenAddr参数必须唯一,vmstorage的-storageDataPath、-vminsertAddr、-vmselectAddr这几个参数必须有唯一的值。

当vmstorage通过-storageDataPath目录大小小于通过-storage.minFreeDiskSpaceBytes指定的可用空间时,会切换到只读模式;vminsert停止向这类节点发送数据,转而将数据发送到其他可用vmstorage节点。

 

责任编辑:姜华 来源: 运维开发故事
相关推荐

2020-06-19 14:55:11

Kubernetes容器技术

2020-08-24 14:56:27

iPhone苹果微信

2019-12-30 08:34:40

ZabbixPrometheus监控

2022-03-02 15:10:31

DateJavaScript前端

2022-09-13 10:40:48

Flowable功能Spring

2019-06-21 14:50:13

Google平板电脑Pixel Slate

2020-06-10 09:06:48

MongoDB架构高可用

2021-12-21 09:05:46

命令Linux敲错

2023-07-29 22:02:06

MyBatis数据库配置

2009-11-24 09:09:05

Chrome OS发布

2016-09-27 21:25:08

Go语言Ken Thompso

2020-06-16 09:17:33

ESRedis监控

2020-05-11 09:00:57

Redis监控Zabbix

2014-02-18 17:23:51

开源微软开放技术

2022-06-01 10:09:39

Linux网络延迟

2024-04-15 00:08:00

MySQLInnoDB数据库

2024-01-17 12:06:52

AI论文

2014-09-12 17:55:42

2018-02-27 08:13:15

Windows10黑科技电脑

2013-12-25 13:50:51

4G运营商TD-LTE
点赞
收藏

51CTO技术栈公众号