在 node 环境中,有两个内置的全局变量无需引入即可直接使用,并且无处不见,它们构成了 nodejs 的模块体系: module 与 require。以下是一个简单的示例
- const fs = require('fs')
- const add = (x, y) => x + y
- module.exports = add
虽然它们在平常使用中仅仅是引入与导出模块,但稍稍深入,便可见乾坤之大。在业界可用它们做一些比较 trick 的事情,虽然我不大建议使用这些黑科技,但稍微了解还是很有必要。
- 如何在不重启应用时热加载模块?如 require 一个 json 文件时会产生缓存,但是重写文件时如何 watch
- 如何通过不侵入代码进行打印日志
- 循环引用会产生什么问题?
module wrapper
当我们使用 node 中写一个模块时,实际上该模块被一个函数包裹,如下所示:
- (function(exports, require, module, __filename, __dirname) {
- // 所有的模块代码都被包裹在这个函数中
- const fs = require('fs')
- const add = (x, y) => x + y
- module.exports = add
- });
因此在一个模块中自动会注入以下变量:
- exports
- require
- module
- __filename
- __dirname
module
调试最好的办法就是打印,我们想知道 module 是何方神圣,那就把它打印出来!
- const fs = require('fs')
- const add = (x, y) => x + y
- module.exports = add
- console.log(module)
- module.id: 如果是 . 代表是入口模块,否则是模块所在的文件名,可见如下的 koa
- module.exports: 模块的导出
koa module
module.exports 与 exports
❝ `module.exports` 与 `exports` 有什么关系?[1] ❞
从以下源码中可以看到 module wrapper 的调用方 module._compile 是如何注入内置变量的,因此根据源码很容易理解一个模块中的变量:
- exports: 实际上是 module.exports 的引用
- require: 大多情况下是 Module.prototype.require
- module
- __filename
- __dirname: path.dirname(__filename)
- // <node_internals>/internal/modules/cjs/loader.js:1138
- Module.prototype._compile = function(content, filename) {
- // ...
- const dirname = path.dirname(filename);
- const require = makeRequireFunction(this, redirects);
- let result;
- // 从中可以看出:exports = module.exports
- const exports = this.exports;
- const thisValue = exports;
- const module = this;
- if (requireDepth === 0) statCache = new Map();
- if (inspectorWrapper) {
- result = inspectorWrapper(compiledWrapper, thisValue, exports,
- require, module, filename, dirname);
- } else {
- result = compiledWrapper.call(thisValue, exports, require, module,
- filename, dirname);
- }
- // ...
- }
require
通过 node 的 REPL 控制台,或者在 VSCode 中输出 require 进行调试,可以发现 require 是一个极其复杂的对象
require
从以上 module wrapper 的源码中也可以看出 require 由 makeRequireFunction 函数生成,如下
- // <node_internals>/internal/modules/cjs/helpers.js:33
- function makeRequireFunction(mod, redirects) {
- const Module = mod.constructor;
- let require;
- if (redirects) {
- // ...
- } else {
- // require 实际上是 Module.prototype.require
- require = function require(path) {
- return mod.require(path);
- };
- }
- function resolve(request, options) { // ... }
- require.resolve = resolve;
- function paths(request) {
- validateString(request, 'request');
- return Module._resolveLookupPaths(request, mod);
- }
- resolve.paths = paths;
- require.main = process.mainModule;
- // Enable support to add extra extension types.
- require.extensions = Module._extensions;
- require.cache = Module._cache;
- return require;
- }
❝ 关于 require 更详细的信息可以去参考官方文档: Node API: require[2] ❞
require(id)
require 函数被用作引入一个模块,也是平常最常见最常用到的函数
- // <node_internals>/internal/modules/cjs/loader.js:1019
- Module.prototype.require = function(id) {
- validateString(id, 'id');
- if (id === '') {
- throw new ERR_INVALID_ARG_VALUE('id', id,
- 'must be a non-empty string');
- }
- requireDepth++;
- try {
- return Module._load(id, this, /* isMain */ false);
- } finally {
- requireDepth--;
- }
- }
而 require 引入一个模块时,实际上通过 Module._load 载入,大致的总结如下:
- 如果 Module._cache 命中模块缓存,则直接取出 module.exports,加载结束
- 如果是 NativeModule,则 loadNativeModule 加载模块,如 fs、http、path 等模块,加载结束
- 否则,使用 Module.load 加载模块,当然这个步骤也很长,下一章节再细讲
- // <node_internals>/internal/modules/cjs/loader.js:879
- Module._load = function(request, parent, isMain) {
- let relResolveCacheIdentifier;
- if (parent) {
- // ...
- }
- const filename = Module._resolveFilename(request, parent, isMain);
- const cachedModule = Module._cache[filename];
- // 如果命中缓存,直接取缓存
- if (cachedModule !== undefined) {
- updateChildren(parent, cachedModule, true);
- return cachedModule.exports;
- }
- // 如果是 NativeModule,加载它
- const mod = loadNativeModule(filename, request);
- if (mod && mod.canBeRequiredByUsers) return mod.exports;
- // Don't call updateChildren(), Module constructor already does.
- const module = new Module(filename, parent);
- if (isMain) {
- process.mainModule = module;
- module.id = '.';
- }
- Module._cache[filename] = module;
- if (parent !== undefined) { // ... }
- let threw = true;
- try {
- if (enableSourceMaps) {
- try {
- // 如果不是 NativeModule,加载它
- module.load(filename);
- } catch (err) {
- rekeySourceMap(Module._cache[filename], err);
- throw err; /* node-do-not-add-exception-line */
- }
- } else {
- module.load(filename);
- }
- threw = false;
- } finally {
- // ...
- }
- return module.exports;
- };
require.cache
「当代码执行 require(lib) 时,会执行 lib 模块中的内容,并作为一份缓存,下次引用时不再执行模块中内容」。
这里的缓存指的就是 require.cache,也就是上一段指的 Module._cache
- // <node_internals>/internal/modules/cjs/loader.js:899
- require.cache = Module._cache;
这里有个小测试:
❝ 有两个文件: index.js 与 utils.js。utils.js 中有一个打印操作,当 index.js 引用 utils.js 多次时,utils.js 中的打印操作会执行几次。代码示例如下 ❞
「index.js」
- // index.js
- // 此处引用两次
- require('./utils')
- require('./utils')
「utils.js」
- // utils.js
- console.log('被执行了一次')
「答案是只执行了一次」,因此 require.cache,在 index.js 末尾打印 require,此时会发现一个模块缓存
- // index.js
- require('./utils')
- require('./utils')
- console.log(require)
那回到本章刚开始的问题:
❝ 如何不重启应用热加载模块呢? ❞
答:「删掉 Module._cache」,但同时会引发问题,如这种 一行 delete require.cache 引发的内存泄漏血案[3]
所以说嘛,这种黑魔法大幅修改核心代码的东西开发环境玩一玩就可以了,千万不要跑到生产环境中去,毕竟黑魔法是不可控的。
总结
- 模块中执行时会被 module wrapper 包裹,并注入全局变量 require 及 module 等
- module.exports 与 exports 的关系实际上是 exports = module.exports
- require 实际上是 module.require
- require.cache 会保证模块不会被执行多次
- 不要使用 delete require.cache 这种黑魔法