又一个基于 Esbuild 的神器!

开发 开发工具
本文的主角是由 antfu 大佬开源的 esno 项目,接下来我将带大家一起来揭开这个项目背后的秘密。

Node.js 并不支持直接执行 TS 文件,如果要执行 TS 文件的话,我们就可以借助 ts-node 这个库。相信有些小伙伴在工作中也用过这个库,关于 ts-node 这个库的相关内容我就不展开介绍了,因为本文的主角是由 antfu 大佬开源的 esno 项目,接下来我将带大家一起来揭开这个项目背后的秘密。

阅读完本文后,你将了解 esno 项目是如何执行 TS 文件。此外,你还会了解如何劫持 Node.js 的 require 函数、如何为 ES Module 的 import 语句添加钩子及如何自定义 https 加载器,以支持 import React from "https://esm.sh/react" 导入方式。

esno 是什么

esno 是基于 esbuild 的 TS/ESNext node 运行时。该库会针对不同的模块化标准,采用不同的方案:

  • esno - Node in CJS mode - by esbuild-register
  • esmo - Node in ESM mode - by esbuild-node-loader

使用 esno 的方式很简单,你可以以全局或局部的方式来安装它:

全局安装

$ npm i -g esno

在安装成功后,你就可以通过以下方式来直接执行 TS 文件:

$ esno index.ts
$ esmo index.ts

局部安装

$ npm i esno

而对于局部安装的方式来说,一般情况下,我们会以 npm scripts 的方式来使用它:

{
"scripts": {
"start": "esno index.ts"
},
"dependencies": {
"esno": "0.14.0"
}
}

esno 是如何工作的

在开始分析 esno 的工作原理之前,我们先来熟悉一下该项目:

├── LICENSE
├── README.md
├── esmo.mjs
├── esno.js
├── package.json
├── pnpm-lock.yaml
├── publish.ts
└── tsconfig.json

观察以上的项目结构可知,该项目并不会复杂。在项目根目录下的 package.json 文件中,我们看到了前面介绍的 esno 和 esmo 命令。

{
"bin": {
"esno": "esno.js",
"esmo": "esmo.mjs"
},
}

此外,在 package.json 的 scripts 字段中,我们发现了 release 命令。顾名思义,该命令用来发布版本。

{
"scripts": {
"release": "npx bumpp --tag --commit --push && node esmo.mjs publish.ts"
},
}

需要注意的是,在 publish.ts 文件中,使用到了 2021 年度 Github 上最耀眼的项目 zx,利用该项目我们可以轻松地编写命令行脚本。写作本文时,它的 Star 数已经高达 27.5K,强烈推荐感兴趣的小伙伴关注一下该项目。

简单介绍了 esno 项目之后,接下来我们来分析 esno.js 文件:

#!/usr/bin/env node

const spawn = require('cross-spawn')
const spawnSync = spawn.sync

const register = require.resolve('esbuild-register')

const argv = process.argv.slice(2)

process.exit(spawnSync('node', ['-r', register, ...argv],
{ stdio: 'inherit' }).status)

由以上代码可知,当执行 esno index.ts 命令后,会通过 spawnSync 来启动 Node.js 程序执行脚本。需要注意的是,在执行时使用了 -r 选项,该选项的作用是预加载模块:

-r, --require = ... module to preload (option can be repeated)

这里预加载的模块是 esbuild-register,该模块就是 esno 命令执行 TS 文件的幕后英雄。

esbuild-register 是什么

esbuild-register 是一个基于 esbuild 来转换 JSX、TS 和 esnext 特性的工具。你可以通过以下多种方式来安装它:

$ npm i esbuild esbuild-register -D
# Or Yarn
$ yarn add esbuild esbuild-register --dev
# Or pnpm
$ pnpm add esbuild esbuild-register -D

在成功安装该模块之后,就可以在命令行中,直接通过 node 应用程序来执行 ts 文件:

$ node -r esbuild-register file.ts

-r, --require = ... module to preload (option can be repeated)

-r 用于指定预加载的文件,即在执行 file.ts 文件前,提前加载 esbuild-register 模块

它将会使用 tsconfig.json 中的 jsxFactory,jsxFragmentFactory 和 target 配置项来执行转换操作。

esbuild-register 不仅可以在命令行中使用,而且还可以通过 API 的方式进行使用:

const { register } = require('esbuild-register/dist/node')

const { unregister } = register({
// ...options
})

// Unregister the require hook if you don't need it anymore
unregister()

了解完 esbuild-register 的基本使用之后,接下来我们来分析它内部是如何工作的。

esbuild-register 是如何工作的

esbuild-register 内部利用了 pirates 这个库来劫持 Node.js 的 require 函数,从而让你可以在命令行中,直接执行 ts 文件。下面我们来看一下 esbuild-register 模块中定义的 register 函数:

// esbuild-register/src/node.ts
import { transformSync, TransformOptions } from 'esbuild'
import { addHook } from 'pirates'

export function register(esbuildOptions: RegisterOptions = {}) {
const {
extensions = DEFAULT_EXTENSIONS,
hookIgnoreNodeModules = true,
hookMatcher,
...overrides
} = esbuildOptions

// 利用 transformSync
const compile: COMPILE = function compile(code, filename, format) {
const dir = dirname(filename)
const options = getOptions(dir)
format = format ?? inferPackageFormat(dir, filename)

const {
code: js,
warnings,
map: jsSourceMap,
} = transformSync(code, {
sourcefile: filename,
sourcemap: 'both',
loader: getLoader(filename),
target: options.target,
jsxFactory: options.jsxFactory,
jsxFragment: options.jsxFragment,
format,
...overrides,
})
// 省略部分代码
}

const revert = addHook(compile, {
exts: extensions,
ignoreNodeModules: hookIgnoreNodeModules,
matcher: hookMatcher,
})

return {
unregister() {
revert()
},
}
}

观察以上的代码可知,在 register 函数内部是利用 esbuild 模块提供的 transformSync API 来实现 ts -> js 代码的转换。其实最关键的环节,还是通过调用 pirates 这个库提供的 addHook 函数来注册编译 ts 文件的钩子。那么 addHook 函数内部到底做了哪些处理呢?下面我们来看一下它的实现:

// pirates-4.0.5/src/index.js
export function addHook(hook, opts = {}) {
let reverted = false;
const loaders = []; // 存放新的loader
const oldLoaders = []; // 存放旧的loader
let exts;

const originalJSLoader = Module._extensions['.js']; // 原始的JS Loader
// 省略部分代码
exts.forEach((ext) => {
// 获取已注册的loader,若未找到,则默认使用JS Loader
const oldLoader = Module._extensions[ext] || originalJSLoader;
oldLoaders[ext] = Module._extensions[ext];

loaders[ext] = Module._extensions[ext] = function newLoader(
mod, filename) {
let compile;
if (!reverted) {
if (shouldCompile(filename, exts, matcher, ignoreNodeModules)) {
compile = mod._compile;
mod._compile = function _compile(code) {
// 这里需要恢复成原来的_compile函数,否则会出现死循环
mod._compile = compile;
// 在编译前先执行用户自定义的hook函数
const newCode = hook(code, filename);
if (typeof newCode !== 'string') {
throw new Error(HOOK_RETURNED_NOTHING_ERROR_MESSAGE);
}

return mod._compile(newCode, filename);
};
}
}

oldLoader(mod, filename);
};
});
}

其实 addHook 函数的实现并不会复杂,该函数内部就是通过替换 mod._compile 方法来实现钩子的功能。即在调用原始的 mod._compile 方法进行编译前,会先调用 hook(code, filename)函数来执行用户自定义的 hook 函数,从而对代码进行预处理。

而对于 esbuild-register 库中的 register 函数来说,当 hook 函数执行时,就会调用该函数内部定义的 compile 函数来编译 ts 代码,然后再调用mod._compile 方法编译生成的 js 代码。

关于 esbuild-register 和 pirates 这两个库的内容就先介绍到这里,如果你想详细了解 pirates 这个库是如何工作的,可以阅读 如何为 Node.js 的 require 函数添加钩子? 这篇文章。

现在我们已经分析完 esno.js 文件,接下来我们来分析 esmo.mjs 文件。

esmo 是如何工作的

esmo 命令对应的是 esmo.mjs 文件:

#!/usr/bin/env node

import spawn from 'cross-spawn'
import { resolve } from 'import-meta-resolve'
const spawnSync = spawn.sync

const argv = process.argv.slice(2)
resolve('esbuild-node-loader', import.meta.url).then((path) => {
process.exit(spawnSync('node', ['--loader', path, ...argv],
{ stdio: 'inherit' }).status)
})

由以上代码可知,当使用 node 应用程序执行 ES Module 文件时,会通过 --loader 选项来指定自定义的 ES Module 加载器。

--loader, --experimental-loader = ... use the specified module as a custom loader

需要注意的是,通过 --loader 选项指定的自定义加载器只适用于 ES Module 的 import 调用,并不适用于 CommonJS 的 require 调用。

那么自定义加载器有什么作用呢?在当前最新的 Node.js v17.4.0 版本中,还不支持以 https://开头的说明符。我们可以在自定义加载器中,利用 Node.js 提供的钩子机制,让 Node.js 可以使用import 导入以 https:// 协议开头的 ES 模块。

在分析如何自定义 https 资源加载器前,我们需要先介绍一下 import 说明符的概念。

import 说明符

import 语句的说明符是 from 关键字之后的字符串,例如 import { sep } from 'path' 中的 'path'。说明符也用于 export from 语句,并作为import() 表达式的参数。

责任编辑:武晓燕 来源: 全栈修仙之路
相关推荐

2023-05-14 23:38:43

Glarity用户视频

2020-02-18 20:28:23

AI人工智能

2020-01-20 14:40:39

工具代码开发

2022-11-30 10:59:20

2014-10-11 09:15:36

2012-04-12 09:53:02

2017-08-31 10:32:35

交付技术

2021-12-29 18:18:59

开源MedusaShopify

2021-01-29 09:07:39

数据保护信息安全数据隐私

2009-04-22 15:16:30

2022-07-14 10:54:15

Python代码Matplotlib

2011-08-16 17:36:50

SolarisIllumos

2014-12-01 12:57:46

亚马逊天猫海淘

2012-06-25 10:20:22

敏捷开发

2018-09-30 08:00:15

区块链碳排放气候

2015-07-09 14:41:15

2009-08-17 08:54:56

2020-07-23 08:24:14

CSS伪类选择器

2022-07-27 12:07:58

云计算公有云云支出

2012-02-13 09:42:41

备份服务器数据中心
点赞
收藏

51CTO技术栈公众号