作者简介:五月君,Software Designer,公众号「Nodejs技术栈」作者。
Async Hooks 一个实际的使用场景是存储请求上下文,在异步调用之间共享数据。上节对基础使用做了介绍,还没看的参见之前的分享 使用 Node.js 的 Async Hooks 模块追踪异步资源。
本节将会介绍如何基于 Async hooks 提供的 API 从零开始实现一个 AsyncLocalStorage 类(异步本地存储)及在 HTTP 请求中关联日志的 traceId 实现链路追踪,这也是 Async Hooks 的一个实际应用场景了。
何为异步本地存储?
我们所说的异步本地存储类似于多线程编程语言中的线程本地存储。拿之前笔者写过的 Java 做个举例,例如 Java 中的 ThreadLocal 类,可以为使用相同变量的不同线程创建一个各自的副本,避免共享资源产生的冲突,在一个线程请求之内通过 get()/set() 方法获取或设置这个变量在当前线程中对应的副本值,在多线程并发访问时线程之间各自创建的副本互不影响。
在 Node.js 中我们的业务通常都工作在主线程(使用 work_threads 除外),是没有 ThreadLocal 类的。并且以事件驱动的方式来处理所有的 HTTP 请求,每个请求过来之后又都是异步的,异步之间还很难去追踪上下文信息,我们想做的是在这个异步事件开始,例如从接收 HTTP 请求到响应,能够有一种机可以让我们随时随地去获取在这期间的一些共享数据,也就是我们本节所提的异步本地存储技术。
在接下来我会讲解实现 AsyncLocalStorage 的四种方式,从最开始的手动实现到官方 v14.x 支持的 AsyncLocalStorage 类,你也可以从中学习到其实现原理。
现有业务问题
假设,现在有一个需求对现有日志系统做改造,所有记录日志的地方增加 traceId 实现全链路日志追踪。
一种情况是假设你使用一些类似 Egg.js 这样的企业级框架,可以依赖于框架提供的中间件能力在请求上挂载 traceId,可以看看之前的一篇文章 基于 Egg.js 框架的日志链路追踪实践 也是可以实现的,不过当时是基于 egg 的一个插件自己做了继承实现,现在已经不需要这么麻烦,可以通过配置自定义日志格式来实现 https://eggjs.org/zh-cn/core/logger.html#自定义日志格式。
另一种情况假设你是用的 Express、Koa 这些基础框架,所有业务都是模块加载函数式调用,如果每次把请求的 traceId 手动在 Controller -> Service -> Model 之间传递,这样对业务代码的侵入太大了,日志与业务的耦合度就太高了。
如下代码,是我精简后的一个例子,现在有一个需求,在不更改业务代码的情况下每次日志打印都输出当前 HTTP 请求处理 Headers 中携带的 traceId 字段,如果是你会怎么做呢?
- // logger.js
- const logger = {
- info: (...args) => {
- console.log(...args);
- }
- }
- module.exports = { logger }
- // app.js
- const express = require('express');
- const app = express();
- const PORT = 3000;
- const { logger } = require('./logger');
- global.logger = contextLogger;
- app.use((req, res, next) => contextLogger.run(req, next));
- app.get('/logger', async (req, res, next) => {
- try {
- const users = await getUsersController();
- res.json({ code: 'SUCCESS', message: '', data: users });
- } catch (error) {
- res.json({ code: 'ERROR', message: error.message })
- }
- });
- app.listen(PORT, () => console.log(`server is listening on ${PORT}`));
- async function getUsersController() {
- logger.info('Get user list at controller layer.');
- return getUsersService();
- }
- async function getUsersService() {
- logger.info('Get user list at service layer.');
- setTimeout(function() { logger.info('setTimeout 2s at service layer.') }, 3000);
- return getUsersModel();
- }
- async function getUsersModel() {
- logger.info('Get user list at model layer.');
- return [];
- }
方式一:动手实现异步本地存储
解决方案是实现请求上下文本地存储,在当前作用域代码中能够获取上下文信息,待处理完毕清除保存的上下文信息,这些需求可以通过 Async Hooks 提供的 API 实现。
创建 AsyncLocalStorage 类
- 行 {1} 创建一个 Map 集合存储上下文信息。
- 行 {2} 里面的 init 回调是重点,当一个异步事件被触发前会先收到 init 回调,其中 triggerAsyncId 是当前异步资源的触发者,我们则可以在这里获取上个异步资源的信息存储至当前异步资源中。当 asyncId 对应的异步资源被销毁时会收到 destroy 回调,所以最后要记得在 destroy 回调里清除当前 asyncId 里存储的信息。
- 行 {3} 拿到当前请求上下文的 asyncId 做为 Map 集合的 Key 存入传入的上下文信息。
- 行 {4} 拿到 asyncId 获取当前代码的上下文信息。
- // AsyncLocalStorage.js
- const asyncHooks = require('async_hooks');
- const { executionAsyncId } = asyncHooks;
- class AsyncLocalStorage {
- constructor() {
- this.storeMap = new Map(); // {1}
- this.createHook(); // {2}
- }
- createHook() {
- const ctx = this;
- const hooks = asyncHooks.createHook({
- init(asyncId, type, triggerAsyncId) {
- if (ctx.storeMap.has(triggerAsyncId)) {
- ctx.storeMap.set(asyncId, ctx.storeMap.get(triggerAsyncId));
- }
- },
- destroy(asyncId) {
- ctx.storeMap.delete(asyncId);
- }
- });
- hooks.enable();
- }
- run(store, callback) { // {3}
- this.storeMap.set(executionAsyncId(), store);
- callback();
- }
- getStore() { // {4}
- return this.storeMap.get(executionAsyncId());
- }
- }
- module.exports = AsyncLocalStorage;
注意,在我们定义的 createHook() 方法里有 hooks.enable(); 这样一段代码,这是因为 Promise 默认是没有开启的,通过显示的调用可以开启 Promise 的异步追踪。
改造 logger.js 文件
在我们需要打印日志的地方拿到当前代码所对应的上下文信息,取出我们存储的 traceId, 这种方式只需要改造我们日志中间即可,不需要去更改我们的业务代码。
- const { v4: uuidV4 } = require('uuid');
- const AsyncLocalStorage = require('./AsyncLocalStorage');
- const asyncLocalStorage = new AsyncLocalStorage();
- const logger = {
- info: (...args) => {
- const traceId = asyncLocalStorage.getStore();
- console.log(traceId, ...args);
- },
- run: (req, callback) => {
- asyncLocalStorage.run(req.headers.requestId || uuidV4(), callback);
- }
- }
- module.exports = {
- logger,
- }
改造 app.js 文件
注册一个中间件,传递请求信息。
- app.use((req, res, next) => logger.run(req, next));
运行后输出结果
- e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a Get user list at router layer.
- e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a Get user list at controller layer.
- e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a Get user list at service layer.
- e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a Get user list at model layer.
- e82d1a1f-5038-4ac9-a9c8-2aa5abb0f96a setTimeout 2s at service layer.
这种方式就是完全基于 Async Hooks 提供的 API 来实现,不理解其实现原理的可以在动手实践下,这种方式需要我们额外维护维护一个 Map 对象,还要处理销毁操作。
方式二:executionAsyncResource() 返回当前执行的异步资源
executionAsyncResource() 返回当前执行的异步资源,这对于实现连续的本地存储很有帮助,无需像 “方式一” 再创建一个 Map 对象来存储元数据。
- const asyncHooks = require('async_hooks');
- const { executionAsyncId, executionAsyncResource } = asyncHooks;
- class AsyncLocalStorage {
- constructor() {
- this.createHook();
- }
- createHook() {
- const hooks = asyncHooks.createHook({
- init(asyncId, type, triggerAsyncId, resource) {
- const cr = executionAsyncResource();
- if (cr) {
- resource[asyncId] = cr[triggerAsyncId];
- }
- }
- });
- hooks.enable();
- }
- run(store, callback) {
- executionAsyncResource()[executionAsyncId()] = store;
- callback();
- }
- getStore() {
- return executionAsyncResource()[executionAsyncId()];
- }
- }
- module.exports = AsyncLocalStorage;
方式三:基于 ResourceAsync 创建 AsyncLocalStorage 类
ResourceAysnc 可以用来自定义异步资源,此处的介绍也是参考 Node.js 源码对 AsyncLocalStorage 的实现。
一个显著的改变是 run() 方法,每一次的调用都会创建一个资源,调用其 runInAsyncScope() 方法,这样在这个资源的异步作用域下,所执行的代码(传入的 callback)都是可追踪我们设置的 store。
- const asyncHooks = require('async_hooks');
- const { executionAsyncResource, AsyncResource } = asyncHooks;
- class AsyncLocalStorage {
- constructor() {
- this.kResourceStore = Symbol('kResourceStore');
- this.enabled = false;
- const ctx = this;
- this.hooks = asyncHooks.createHook({
- init(asyncId, type, triggerAsyncId, resource) {
- const currentResource = executionAsyncResource();
- ctx._propagate(resource, currentResource)
- }
- });
- }
- // Propagate the context from a parent resource to a child one
- _propagate(resource, triggerResource) {
- const store = triggerResource[this.kResourceStore];
- if (store) {
- resource[this.kResourceStore] = store;
- }
- }
- _enable() {
- if (!this.enabled) {
- this.enabled = true;
- this.hooks.enable();
- }
- }
- enterWith(store) {
- this._enable();
- const resource = executionAsyncResource();
- resource[this.kResourceStore] = store;
- }
- run(store, callback) {
- const resource = new AsyncResource('AsyncLocalStorage', {
- requireManualDestroy: true,
- });
- return resource.emitDestroy().runInAsyncScope(() => {
- this.enterWith(store);
- return callback();
- });
- }
- getStore() {
- return executionAsyncResource()[this.kResourceStore];
- }
- }
- module.exports = AsyncLocalStorage;
方式四:AsyncLocalStorage 类
Node.js v13.10.0 async_hooks 模块新加入了 AsyncLocalStorage 类,实例化一个对象调用 run() 方法实现本地存储,也是推荐的方式,不需要自己去再额外维护一个 AsyncLocalStorage 类。
AsyncLocalStorage 类的实现也就是上面讲解的方式三,所以也不需要我们在外部显示的调用 hooks.enable() 来启用 Promise 异步追踪,因为其内部已经实现了。
- const { AsyncLocalStorage } = require('async_hooks');
Async Hooks 的性能开销
这一点是大家最关心的问题,如果开启了 Async Hooks(Promise 需要调用 Async Hooks 实例的 enable() 方法开启)每一次异步操作或 Promise 类型的操作,包括 console 只要是异步的都会触发 hooks,也必然是有性能开销的。
参考 Kuzzle 的性能基准测试,使用了 AsyncLocalStorage 与未使用之间相差 ~8%。
---- | Log with AsyncLocalStorage | Log classic | difference |
---|---|---|---|
req/s | 2613 | 2842 | 〜8% |
当然不同的业务也有着不同的差异,如果你担心会有很大的性能开销,可以基于自己的业务做一些基准测试。
Reference
[1]
nodejs.org/api/async_hooks.html: https://nodejs.org/api/async_hooks.html
[2]
Node.js 14 & AsyncLocalStorage: Share a context between asynchronous calls: https://blog.kuzzle.io/nodejs-14-asynclocalstorage-asynchronous-calls
[3]
在 Node 中通过 Async Hooks 实现请求作用域: https://mp.weixin.qq.com/s/I22TvmTqCKFClsp0YLDoZw
[4]
Async Hooks 性能影响: https://github.com/nodejs/benchmarking/issues/181
[5]
kuzzle 基准测试: https://github.com/kuzzleio/kuzzle/pull/1604
本文转载自微信公众号「Nodejs技术栈」,可以通过以下二维码关注。转载本文请联系Nodejs技术栈公众号。