运维监控系统之Prometheus Server安装

运维 系统运维
Prometheus是Golang写的,编译后就是一个二进制文件,不依赖于第三方运行库。这样子就可以让我们很方便的部署。

 简介

Prometheus是Golang写的,编译后就是一个二进制文件,不依赖于第三方运行库。这样子就可以让我们很方便的部署。

下载安装

Golang的交叉编译,可以很容易实现跨平台。

如果是测试实验可以在下载windows版本的就可以了。

[[360451]]

我这边都是Linux环境,直接下载Linux版本

  1. wget -c https://github.com/prometheus/prometheus/releases/download/v2.23.0/prometheus-2.23.0.linux-amd64.tar.gz 
  2. tar zxvf prometheus-2.23.0.linux-amd64.tar.gz 

 运行

解压后,就可以执行二进制文件prometheus

  1. ./prometheus 

默认配置文件是当前目录下的prometheus.yml

默认配置文件里面只有拉取prometheus自己的指标。

帮助

  1. ./prometheus --help  

prometheus 提供了很多参数可以进行配置,根据实际情况进行设置即可。

  1. usage: prometheus [<flags>] 
  2.  
  3. The Prometheus monitoring server 
  4.  
  5. Flags: 
  6.   -h, --help                     Show context-sensitive help (also try --help-long and --help-man). 
  7.       --version                  Show application version. 
  8.       --config.file="prometheus.yml"   
  9.                                  Prometheus configuration file path. 
  10.       --web.listen-address="0.0.0.0:9090"   
  11.                                  Address to listen on for UI, API, and telemetry. 
  12.       --web.read-timeout=5m      Maximum duration before timing out read of the request, and closing idle connections. 
  13.       --web.max-connections=512  Maximum number of simultaneous connections. 
  14.       --web.external-url=<URL>   The URL under which Prometheus is externally reachable (for example, if Prometheus is served via a reverse proxy). Used for generating relative and absolute links back to 
  15.                                  Prometheus itself. If the URL has a path portion, it will be used to prefix all HTTP endpoints served by Prometheus. If omitted, relevant URL components will be derived 
  16.                                  automatically. 
  17.       --web.route-prefix=<path>  Prefix for the internal routes of web endpoints. Defaults to path of --web.external-url. 
  18.       --web.user-assets=<path>   Path to static asset directory, available at /user. 
  19.       --web.enable-lifecycle     Enable shutdown and reload via HTTP request. 
  20.       --web.enable-admin-api     Enable API endpoints for admin control actions. 
  21.       --web.console.templates="consoles"   
  22.                                  Path to the console template directory, available at /consoles. 
  23.       --web.console.libraries="console_libraries"   
  24.                                  Path to the console library directory. 
  25.       --web.page-title="Prometheus Time Series Collection and Processing Server"   
  26.                                  Document title of Prometheus instance. 
  27.       --web.cors.origin=".*"     Regex for CORS origin. It is fully anchored. Example: 'https?://(domain1|domain2)\.com' 
  28.       --storage.tsdb.path="data/"   
  29.                                  Base path for metrics storage. 
  30.       --storage.tsdb.retention=STORAGE.TSDB.RETENTION   
  31.                                  [DEPRECATED] How long to retain samples in storage. This flag has been deprecated, use "storage.tsdb.retention.time" instead
  32.       --storage.tsdb.retention.time=STORAGE.TSDB.RETENTION.TIME   
  33.                                  How long to retain samples in storage. When this flag is set it overrides "storage.tsdb.retention". If neither this flag nor "storage.tsdb.retention" nor 
  34.                                  "storage.tsdb.retention.size" is set, the retention time defaults to 15d. Units Supported: y, w, d, h, m, s, ms. 
  35.       --storage.tsdb.retention.size=STORAGE.TSDB.RETENTION.SIZE   
  36.                                  [EXPERIMENTAL] Maximum number of bytes that can be stored for blocks. A unit is required, supported units: B, KB, MB, GB, TB, PB, EB. Ex: "512MB". This flag is experimental and 
  37.                                  can be changed in future releases. 
  38.       --storage.tsdb.no-lockfile   
  39.                                  Do not create lockfile in data directory. 
  40.       --storage.tsdb.allow-overlapping-blocks   
  41.                                  [EXPERIMENTAL] Allow overlapping blocks, which in turn enables vertical compaction and vertical query merge. 
  42.       --storage.tsdb.wal-compression   
  43.                                  Compress the tsdb WAL. 
  44.       --storage.remote.flush-deadline=<duration>   
  45.                                  How long to wait flushing sample on shutdown or config reload. 
  46.       --storage.remote.read-sample-limit=5e7   
  47.                                  Maximum overall number of samples to return via the remote read interface, in a single query. 0 means no limit. This limit is ignored for streamed response types. 
  48.       --storage.remote.read-concurrent-limit=10   
  49.                                  Maximum number of concurrent remote read calls. 0 means no limit. 
  50.       --storage.remote.read-max-bytes-in-frame=1048576   
  51.                                  Maximum number of bytes in a single frame for streaming remote read response types before marshalling. Note that client might have limit on frame size as well. 1MB as 
  52.                                  recommended by protobuf by default
  53.       --rules.alert.for-outage-tolerance=1h   
  54.                                  Max time to tolerate prometheus outage for restoring "for" state of alert. 
  55.       --rules.alert.for-grace-period=10m   
  56.                                  Minimum duration between alert and restored "for" state. This is maintained only for alerts with configured "for" time greater than grace period. 
  57.       --rules.alert.resend-delay=1m   
  58.                                  Minimum amount of time to wait before resending an alert to Alertmanager. 
  59.       --alertmanager.notification-queue-capacity=10000   
  60.                                  The capacity of the queue for pending Alertmanager notifications. 
  61.       --alertmanager.timeout=10s   
  62.                                  Timeout for sending alerts to Alertmanager. 
  63.       --query.lookback-delta=5m  The maximum lookback duration for retrieving metrics during expression evaluations and federation. 
  64.       --query.timeout=2m         Maximum time a query may take before being aborted. 
  65.       --query.max-concurrency=20   
  66.                                  Maximum number of queries executed concurrently. 
  67.       --query.max-samples=50000000   
  68.                                  Maximum number of samples a single query can load into memory. Note that queries will fail if they try to load more samples than this into memory, so this also limits the 
  69.                                  number of samples a query can return
  70.       --log.level=info           Only log messages with the given severity or above. One of: [debug, info, warn, error] 
  71.       --log.format=logfmt        Output format of log messages. One of: [logfmt, json] 

 注册成服务

目前linux大部分的发行版本都是使用systemd管理系统服务了,我们可以直接编辑一个systemd的service文件,来部署prometheus服务。

[[360452]]
  1. vim /etc/systemd/system/prometheus.service 

如果没有设置--storage.tsdb.path,记得设置好工作目录WorkingDirectory,不然所有数据都会保存到家目录里面。

  1. [Unit] 
  2. Description=prometheus 
  3. After=network.target 
  4.  
  5. [Service] 
  6. Type=simple 
  7. WorkingDirectory=/opt/prometheus/prometheus 
  8. ExecStart=/opt/prometheus/prometheus/prometheus --config.file="/opt/prometheus/prometheus/prometheus.yml" 
  9. LimitNOFILE=65536 
  10. PrivateTmp=true 
  11. RestartSec=2 
  12. StartLimitInterval=0 
  13. Restart=always 
  14.  
  15. [Install] 
  16. WantedBy=multi-user.target 

 使用systemctl加载文件、控制服务

  1. systemctl daemon-reload  
  2. systemctl enable prometheus 
  3. systemctl start prometheus 

 WebUI

启动之后,默认监听是9090端口,浏览器直接访问即可

  1. http://[ip]:9090 

 【编辑推荐】

 

责任编辑:姜华 来源: 今日头条
相关推荐

2020-12-30 08:09:46

运维Prometheus 监控

2020-12-29 10:45:22

运维Prometheus-监控

2021-07-07 05:46:46

运维监控Prometheus

2020-12-17 09:25:46

运维Prometheus监控

2020-12-30 05:34:25

监控PrometheusGrafana

2022-07-11 13:43:51

Prometheus监控

2023-10-11 09:58:07

2013-04-12 13:30:47

2011-09-01 10:22:03

Cobbler运维自动化

2011-03-21 14:43:42

2018-09-27 08:59:29

2016-04-06 10:02:23

手机微博运维监控

2014-05-16 14:31:55

运维自动化Cobbler

2019-03-15 10:13:10

运维云计算运营

2022-02-08 10:21:17

运维应用监控

2015-09-23 16:46:54

架构监控运维自动化

2019-03-19 08:41:38

Linux运维变更

2011-01-05 15:39:44

2014-07-22 10:06:43

运维监控虚拟化

2015-09-21 13:41:47

高可用监控系统运维自动化
点赞
收藏

51CTO技术栈公众号