只用90行代码实现模块打包器

开发 前端
今天来聊聊如何用90行代码实现一个现代JS模块打包器。我们的打包器虽然迷你,但是实现了webpack的核心功能。而且,我知道你看到大段代码头疼,所以这篇文章都是图。

[[422769]]

大家好,我卡颂。

今天来聊聊如何用90行代码实现一个现代JS模块打包器。

我们的打包器虽然迷你,但是实现了webpack的核心功能。

而且,我知道你看到大段代码头疼,所以这篇文章都是图。看完感兴趣的话,这里是完整代码的仓库地址[1],只有90行代码哦。

让我们愉快的开始吧。

生成依赖图

如果应用是个毛线团的话,那么入口文件就是线头。打包器要做的第一件事是:

顺着线头开始滤清整条线的走向

[[422770]]

假设入口文件是entry.js:

  1. // entry.js 
  2.  
  3. import a from './a.js'
  4. import b from './b.js'
  5.  
  6. console.log(a, b); 

他依赖了a.js与b.js。 


em... 有点太简陋了,让我们再扩展下a.js与b.js:

  1. // a.js 
  2. import c from './c.js'
  3.  
  4. // ... 
  1. // b.js 
  2. import d from './d.js'
  3. import e from './e.js'
  4.  
  5. // ... 

所以整个依赖关系是这样:

打包器会从入口文件开始,尝试建立模块(即js文件)间的依赖关系,也就是刚才我们讲的「顺着线头开始滤清整条线的走向」。

模块间的依赖关系可以通过分析模块代码中的import 声明语句得知。

为了能分析import 声明语句,可以使用babel等编译工具将模块代码分解为AST(抽象语法树)。

遍历AST,类型为ImportDeclaration的节点就是import声明语句。

最后,我们将AST重新转换为可执行的目标代码,可能还需要根据代码要执行的宿主环境(一般为浏览器)对代码做一些转换。

比如,浏览器不支持import './a.js'这样的ESM语法,那么我们需要将所有ESM语法转为CJS语法。

  1. // 源代码 
  2. import './a.js'
  3.  
  4. // 转换后 
  5. require('./a.js'); 

所以,对于任一模块(js文件),会经历:

右边包含目标代码和模块间依赖关系的数据结构被称为asset。

每个asset可以通过模块间依赖关系找到依赖的模块,重复这一过程,生成新的asset,最终形成整个应用所有asset间的依赖关系:

应用完整的依赖关系被称为「依赖图」(dependency graph)。

打包代码

接下来,只需要遍历「依赖图」,将所有asset的目标代码打包在一起就行。

所有代码会被打包在一个「立即执行函数」中:

  1. (function(modules) { 
  2.   // 打包好的代码 
  3. })(modules) 

modules中保存了所有asset及他们之间的依赖关系。

如果你对modules的细节感兴趣,可以去文末仓库里翻代码

刚才说过,asset的目标代码是CJS规范的,类似:

  1. // entry.js 
  2.  
  3. require('./a.js'); 
  4. require('./b.js'); 

这意味着我们需要实现:

  • require方法(用于引入依赖的其他asset的目标代码)
  • module对象(用于保存当前asset的目标代码执行后导出的数据)

同时,为了防止不同asset的目标代码中的变量互相污染,每个目标代码需要独立的作用域。

我们将目标代码包裹在函数中:

  1. // 我们操作的是字符串模版 
  2. `function (require, module, exports) { 
  3.   ${asset.code} 
  4. }` 

所以,最终打包的结果为:

  1. (function(modules) { 
  2.   function require() {// ...} 
  3.    
  4.   require(入口asset的ID) 
  5. })(modules) 

这段字符串被包裹在浏览器  

这段字符串被包裹在浏览器<script>标签内,会依次执行:

  1. require(入口asset的ID),执行入口asset的目标代码
  2. 目标代码内部会调用require执行其他asset的目标代码
  3. 一步步执行下去...

总结

打包器的工作原理分为两步:

  1. 从入口文件开始遍历,生成「依赖图」
  2. 根据依赖图,将代码打包进一个「立即执行函数」

这个打包器还很稚嫩,缺失很多必要的功能,比如:

  • 解决循环依赖
  • 缓存

但是瑕不掩瑜嘛~

参考资料

[1]完整代码的仓库地址: https://github.com/BetaSu/minipack

 

责任编辑:姜华 来源: 魔术师卡颂
相关推荐

2014-06-19 10:02:32

Haskell代码

2019-11-15 15:50:41

JS代码React前端

2021-03-08 15:04:48

编程Python代码

2020-04-02 15:39:51

代码编译器前端

2019-06-05 15:00:28

Java代码区块链

2022-06-29 09:02:31

go脚本解释器

2019-12-03 08:29:39

代码调优网络

2018-08-02 17:39:42

iPhone备忘录iOS

2022-06-28 08:17:10

JSON性能反射

2022-04-09 09:11:33

Python

2022-03-26 22:28:06

加密通信Python

2018-01-23 09:17:22

Python人脸识别

2020-12-17 08:06:33

CSS 日历界面

2018-01-05 14:48:03

前端JavaScript富文本编辑器

2021-12-16 06:21:16

React组件前端

2022-04-15 08:07:21

ReactDiff算法

2020-08-19 10:30:25

代码Python多线程

2022-02-08 12:30:30

React事件系统React事件系统

2021-09-09 06:55:43

Web剪辑视频

2022-03-14 09:57:30

Python代码
点赞
收藏

51CTO技术栈公众号