当网站上线后,流量增加或短暂功能故障,都会造成使用者体验相当不好,而这时该怎么快速找到性能的瓶颈呢?通常 CPU 达到 100% 时,有时候也很难复制及找出关键问题点。
本篇文章,我们会介绍一套工具叫 Pyroscope,让开发者可以快速找到性能瓶颈的代码。Pyroscope 目前可以支持 Python, Ruby 或 Go 的环境。本文笔者会针对 Go 环境做介绍。
什么是 Pyroscope?
Pyroscope 是一套开源的性能即时监控平台,简单的 Server 及 Agent 架构,让开发者可以轻松监控代码性能,不管你要找 10 秒或几分钟内的性能数据,都可以快速的即时呈现,开发者也不用在意装了此监控会造成任何性能上的负担。Pyroscope 背后的储存采用 Badger 这套 Key-Value 数据库,性能上是非常好的。目前只支持 3 种语言 (Python, Ruby 及 Go) 未来会预计支持 NodeJS。假设您还没引入任何性能分析工具或平台,那 Pyroscope 会是您最好的选择。
Pyroscope 架构
如果你有打算找性能分析工具平台,Pyroscope 提供了三大优势,让开发者可以放心使用
- 低 CPU 使用率,不会影响既有平台
- 可储存好几年的资料,并且可用 10 秒细颗粒度查看资料
- 压缩储存资料,减少浪费硬盘空间
- 架构只有分 Server 和 Agent,除了 Go 语言之外,Python 跟 Ruby App 都是透过 pyroscope 指令启动相关 app 来监控系统效能。
Pyroscope 架构图
启动 Pyroscope 服务
启动方式有两种,第一是直接用 docker 指令启动。
- $ docker run -it -p 4040:4040 pyroscope/pyroscope:latest server
另一种可以用 docker-compose 启动。
- ---
- services:
- pyroscope:
- image: "pyroscope/pyroscope:latest"
- ports:
- - "4040:4040"
- command:
- - "server"
安装 Agent
在 Go 语言中使用
本篇用 Go 语言当作示例,先 import package
- import "github.com/pyroscope-io/pyroscope/pkg/agent/profiler"
接著在 main.go 写入底下代码即可:
- profiler.Start(profiler.Config{
- ApplicationName: "simple.golang.app",
- ServerAddress: "http://pyroscope:4040",
- })
其中 http://pyroscope 可以换成自定义的 hostname 即可,接着打开上述网址就可以看到性能监控的画面了。
通过画面,我们可以快速找到是 SQL 或哪个函式执行时间长。
在 Python 和 Ruby 语言中使用
- # If using Python
- $ pyroscope exec python manage.py runserver
- # If using Ruby
- $ pyroscope exec rails server
心得
这套工具相当方便,在 Go 语言虽然可以用 pprof 快速找到问题,但是难免还是需要手动的一些地方才可以查出性能瓶颈,有了这套平台,就可以将全部 App 都进行监控,当使用者有任何问题,就可以快速透过 Pyroscope 查看哪些代码出了问题。