一篇可视化的JS引擎执行流程

开发 前端
JavaScirpt引擎可以将JS代码编译为不同CPU(Intel, ARM以及MIPS等)对应的汇编代码,这样我们才不要去翻阅每个CPU的指令集手册。

[[394708]]

前言

这是一篇不错译文,我强烈推荐的原因在于:

在用动图的形式生动形象的讲述了JavaScript引擎基本原理。

图片制作并非本人,如有侵权,会删除。

接触了前端这么久以来,你每天跟JS打交道,你肯定也和我一样认为JavaScript很酷。但机器怎么能真正理解你写的代码呢?

由上面的思考点,才引出此文:

带你了机一下JavaScript引擎的基本原理,看看它是如何处理我们对人类友好的JS代码,并将其转化为机器所能理解的东西。

作为JavaScript的开发者,清楚明白它的过程,绝对是一件好事情。

基本概念

在这之前,我们得了解一些JS引擎的基础知识。

什么是JS引擎,它帮我们做了什么事情呢?

我们都知道,我们写得代码,经过处理,交给CPU,它是不认识的,无法去执行。而CPU认识的是自己的指令集,指令集对应的是汇编代码。我们不可能去编写这些指令集,于是乎,它出现了:

JavaScirpt引擎可以将JS代码编译为不同CPU(Intel, ARM以及MIPS等)对应的汇编代码,这样我们才不要去翻阅每个CPU的指令集手册。

当然了,编译代码不是它的唯一功能,比如代码的执行,分配内存,垃圾回收机制都是它工作的。

对它有了一个大致的认识,那我们常见的JS引擎有哪些呢?我发现,最知名的肯定是V8,至于一些其他的,感兴趣的可以去查一查资料,

比如还有:

  • SpiderMonkey (Mozilla)
  • JavaScriptCore (Apple)
  • Chakra (Microsoft)
  • IOT:duktape、JerryScript

V8的内容太多了,篇幅有限,后续再出一篇文章聊一聊。

太出名了,所以这篇文章介绍的知识主要基于 Node.js 和基于 Chromium 的浏览器所用的 V8 引擎。

主要流程图

细节很多,所以主要分析的是主要的流程,如图:

从图上,我们可以总结一下几个点:

  • 生成抽象语法树
    • 词法分析
    • 语法分析
  • 生成字节码
  • 执行代码
    • 即时编译
    • 内联缓存

生成抽象语法树

HTML解析器遇到了一个带有源的脚本标签。这个源的代码会从网络、缓存或已安装的服务工作者那里加载。响应是请求的脚本作为字节流,由字节流解码器来处理。字节流解码器对正在下载的字节流进行解码。

进行解码

词法分析

生成抽象语法树的 第一个阶段是分词(tokenize),又叫词法分析。

字节流解码器会先从代码字节流中创建 令牌 (token)。

注:令牌可以理解为语法上不可能再分的,最小的单个字符或字符串)。

例如,0066解码为f,0075解码为u,006e解码为n,0063解码为c,0074解码为t,0069解码为i,006f解码为o,006e解码为n,接着后面是一个空格。然后你会发现,他们组合起来就是 function。

这是JavaScript中的一个保留关键字。

一个令牌被创建,并被发送到解析器(parser)。其余的字节流也是如此,具体如下图:

词法分析

语法分析

第二个阶段是解析(parse),也叫语法分析。

该引擎使用两个解析器:预解析器和解析器。为了减少加载网站的时间,该引擎试图避免解析那些不需要立即使用的代码。

预解析器处理以后可能会用到的代码,而解析器则处理立即需要的代码!

如果某个函数只有在用户点击某个按钮后才会被调用,那么就没有必要为了加载网站而立即编译这段代码了。

如果用户最终点击了按钮,需要那段代码,它就会被送到解析器中。

解析器根据它从字节流解码器收到的标记创建节点。通过这些节点,它创建了一个抽象语法树或AST,如图:

语法分析

值得思考的是,AST到底是什么呢?(到底是怎么样的一个数据结构呢,babel里面是不是也有这些概念呢)

接下来,是解释器的时间了,解释器浏览AST,并根据AST包含的信息生成字节代码。一旦字节码被完全生成,AST就会被删除,从而清除内存空间。最后,我们有了一个机器可以工作的东西。

生成字节码

刚刚我们提到,解释器浏览AST,并根据AST包含的信息生成字节代码,那么它的过程是怎么样的呢?

大致上,你可以这么理解:

AST交给解释器(interpreter),遍历整个AST,就会生成字节码。当字节码生成后,AST 便会被删除以节省内存空间。最终我们得到了更贴近 机器码 的 字节码。

这里的 字节码 是介于 AST 和 机器码 之间的一种代码,它还是需要通过 解释器 将其转换为 机器码 后才能执行

那我们通过一个图来看看它的过程吧:

生成字节码

代码执行

我们有了字节码后,就可以进入执行阶段了。

即使编译

虽然字节码的速度很快,但它还可以更快。当这个字节码运行时,信息就会被生成。

它可以检测到某些行为是否经常发生,以及被使用的数据类型。也许你一直在调用一个函数几十次:是时候优化它了,这样它的运行速度会更快 。字节代码,连同生成的类型反馈,被发送到优化编译器。优化编译器接收字节码和类型反馈,并从中生成高度优化的机器代码。

这种技术也被称为 即时编译(JIT:Just In Time),而上面所说的 优化编译器 也叫 JIT 编译器。

具体的话,可以参考下面的图:

及时编译

内联缓存

JavaScript是一种动态类型的语言,这意味着数据的类型可以不断变化。如果JavaScript引擎每次都要检查某个值的数据类型,那就会非常慢。

处于上诉所说,引擎有了一种叫做内联缓存 (inline caching) 的技术。

具体流程是这样子的:

为了减少解释代码的时间,优化的机器代码只处理引擎在运行字节码时曾经见过的情况。如果我们反复使用某段代码,反复返回相同的数据类型,那么优化后的机器代码可以简单地重复使用,以加快速度。

然而,由于JavaScript是动态类型的,可能会发生同一段代码突然返回不同类型的数据。如果发生这种情况,机器代码就会被取消优化,引擎就会退回到解释生成的字节码。假设某个函数被调用了100次,到目前为止总是返回相同的值。它将假设在你第101次调用它时,它也会返回这个值。

假设我们有以下函数sum,(到目前为止)每次都是以数值作为参数来调用,如图:

如果这是真的,就不需要动态查找,它可以重新使用优化后的机器代码。否则,如果假设不正确,它就会恢复到原来的字节码,而不是优化后的机器码。例如,下一次我们调用它时,我们传递一个字符串而不是一个数字。由于JavaScript是动态类型的,我们可以这样做而不会有任何错误!

如图:

这意味着数字2将被强制变成一个字符串,而函数将返回字符串 "12"。它回到执行解释的字节码并更新类型反馈。

总结

篇幅不多,但或多或少对你有帮助,让你对JS引擎的执行流程有了解。你想了解更多的话,欢迎查原文V8官网的docs:

https://v8.dev/docs

我是TianTian,我们下一期见!!!

参考链接

[1] Celebrating 10 years of V8: https://v8.dev/blog/10-years

[2] Launching Ignition and TurboFan: https://v8.dev/blog/launching-ignition-and-turbofan

[3] Understanding V8’s Bytecode: https://medium.com/dailyjs/understanding-v8s-bytecode-317d46c94775

[4] An Introduction to Speculative Optimization in V8: https://benediktmeurer.de/2017/12/13/an-introduction-to-speculative-optimization-in-v8/

[5] JavaScript Visualized: the JavaScript Engine: https://dev.to/lydiahallie/javascript-visualized-the-javascript-engine-4cdf

[6] The V8 JavaScript Engine: https://nodejs.dev/learn/the-v8-javascript-engine前言

这是一篇不错译文,我强烈推荐的原因在于:

在用动图的形式生动形象的讲述了JavaScript引擎基本原理。

图片制作并非本人,如有侵权,会删除。

接触了前端这么久以来,你每天跟JS打交道,你肯定也和我一样认为JavaScript很酷。但机器怎么能真正理解你写的代码呢?

由上面的思考点,才引出此文:

带你了机一下JavaScript引擎的基本原理,看看它是如何处理我们对人类友好的JS代码,并将其转化为机器所能理解的东西。

作为JavaScript的开发者,清楚明白它的过程,绝对是一件好事情。

基本概念

在这之前,我们得了解一些JS引擎的基础知识。

什么是JS引擎,它帮我们做了什么事情呢?

我们都知道,我们写得代码,经过处理,交给CPU,它是不认识的,无法去执行。而CPU认识的是自己的指令集,指令集对应的是汇编代码。我们不可能去编写这些指令集,于是乎,它出现了:

JavaScirpt引擎可以将JS代码编译为不同CPU(Intel, ARM以及MIPS等)对应的汇编代码,这样我们才不要去翻阅每个CPU的指令集手册。

当然了,编译代码不是它的唯一功能,比如代码的执行,分配内存,垃圾回收机制都是它工作的。

对它有了一个大致的认识,那我们常见的JS引擎有哪些呢?我发现,最知名的肯定是V8,至于一些其他的,感兴趣的可以去查一查资料,

比如还有:

SpiderMonkey (Mozilla)

JavaScriptCore (Apple)

Chakra (Microsoft)

IOT:duktape、JerryScript

V8的内容太多了,篇幅有限,后续再出一篇文章聊一聊。

太出名了,所以这篇文章介绍的知识主要基于 Node.js 和基于 Chromium 的浏览器所用的 V8 引擎。

主要流程图

细节很多,所以主要分析的是主要的流程,如图:

图片

从图上,我们可以总结一下几个点:

生成抽象语法树

词法分析

语法分析

生成字节码

执行代码

即时编译

内联缓存

生成抽象语法树

HTML解析器遇到了一个带有源的脚本标签。这个源的代码会从网络、缓存或已安装的服务工作者那里加载。响应是请求的脚本作为字节流,由字节流解码器来处理。字节流解码器对正在下载的字节流进行解码。

图片

进行解码

词法分析

生成抽象语法树的 第一个阶段是分词(tokenize),又叫词法分析。

字节流解码器会先从代码字节流中创建 令牌 (token)。

注:令牌可以理解为语法上不可能再分的,最小的单个字符或字符串)。

例如,0066解码为f,0075解码为u,006e解码为n,0063解码为c,0074解码为t,0069解码为i,006f解码为o,006e解码为n,接着后面是一个空格。然后你会发现,他们组合起来就是 function。

这是JavaScript中的一个保留关键字。

一个令牌被创建,并被发送到解析器(parser)。其余的字节流也是如此,具体如下图:

图片

词法分析

语法分析

第二个阶段是解析(parse),也叫语法分析。

该引擎使用两个解析器:预解析器和解析器。为了减少加载网站的时间,该引擎试图避免解析那些不需要立即使用的代码。

预解析器处理以后可能会用到的代码,而解析器则处理立即需要的代码!

如果某个函数只有在用户点击某个按钮后才会被调用,那么就没有必要为了加载网站而立即编译这段代码了。

如果用户最终点击了按钮,需要那段代码,它就会被送到解析器中。

解析器根据它从字节流解码器收到的标记创建节点。通过这些节点,它创建了一个抽象语法树或AST,如图:

图片

语法分析

值得思考的是,AST到底是什么呢?(到底是怎么样的一个数据结构呢,babel里面是不是也有这些概念呢)

接下来,是解释器的时间了,解释器浏览AST,并根据AST包含的信息生成字节代码。一旦字节码被完全生成,AST就会被删除,从而清除内存空间。最后,我们有了一个机器可以工作的东西。

生成字节码

刚刚我们提到,解释器浏览AST,并根据AST包含的信息生成字节代码,那么它的过程是怎么样的呢?

大致上,你可以这么理解:

AST交给解释器(interpreter),遍历整个AST,就会生成字节码。当字节码生成后,AST 便会被删除以节省内存空间。最终我们得到了更贴近 机器码 的 字节码。

这里的 字节码 是介于 AST 和 机器码 之间的一种代码,它还是需要通过 解释器 将其转换为 机器码 后才能执行

那我们通过一个图来看看它的过程吧:

图片

生成字节码

代码执行

我们有了字节码后,就可以进入执行阶段了。

即使编译

虽然字节码的速度很快,但它还可以更快。当这个字节码运行时,信息就会被生成。

它可以检测到某些行为是否经常发生,以及被使用的数据类型。也许你一直在调用一个函数几十次:是时候优化它了,这样它的运行速度会更快 。字节代码,连同生成的类型反馈,被发送到优化编译器。优化编译器接收字节码和类型反馈,并从中生成高度优化的机器代码。

这种技术也被称为 即时编译(JIT:Just In Time),而上面所说的 优化编译器 也叫 JIT 编译器。

具体的话,可以参考下面的图:

图片

及时编译

内联缓存

JavaScript是一种动态类型的语言,这意味着数据的类型可以不断变化。如果JavaScript引擎每次都要检查某个值的数据类型,那就会非常慢。

处于上诉所说,引擎有了一种叫做内联缓存 (inline caching) 的技术。

具体流程是这样子的:

为了减少解释代码的时间,优化的机器代码只处理引擎在运行字节码时曾经见过的情况。如果我们反复使用某段代码,反复返回相同的数据类型,那么优化后的机器代码可以简单地重复使用,以加快速度。

然而,由于JavaScript是动态类型的,可能会发生同一段代码突然返回不同类型的数据。如果发生这种情况,机器代码就会被取消优化,引擎就会退回到解释生成的字节码。假设某个函数被调用了100次,到目前为止总是返回相同的值。它将假设在你第101次调用它时,它也会返回这个值。

假设我们有以下函数sum,(到目前为止)每次都是以数值作为参数来调用,如图:

图片

如果这是真的,就不需要动态查找,它可以重新使用优化后的机器代码。否则,如果假设不正确,它就会恢复到原来的字节码,而不是优化后的机器码。例如,下一次我们调用它时,我们传递一个字符串而不是一个数字。由于JavaScript是动态类型的,我们可以这样做而不会有任何错误!

如图:

图片

这意味着数字2将被强制变成一个字符串,而函数将返回字符串 "12"。它回到执行解释的字节码并更新类型反馈。

总结

篇幅不多,但或多或少对你有帮助,让你对JS引擎的执行流程有了解。你想了解更多的话,欢迎查原文V8官网的docs:

https://v8.dev/docs

我是TianTian,我们下一期见!!!

参考链接

[1] Celebrating 10 years of V8: https://v8.dev/blog/10-years

[2] Launching Ignition and TurboFan: https://v8.dev/blog/launching-ignition-and-turbofan

[3] Understanding V8’s Bytecode: https://medium.com/dailyjs/understanding-v8s-bytecode-317d46c94775

[4] An Introduction to Speculative Optimization in V8: https://benediktmeurer.de/2017/12/13/an-introduction-to-speculative-optimization-in-v8/

[5] JavaScript Visualized: the JavaScript Engine: https://dev.to/lydiahallie/javascript-visualized-the-javascript-engine-4cdf

[6] The V8 JavaScript Engine: https://nodejs.dev/learn/the-v8-javascript-engine

 

责任编辑:武晓燕 来源: TianTianUp
相关推荐

2021-03-01 07:45:32

kubernetes应用程序工具

2017-08-04 15:33:33

大数据数据可视化方法

2022-05-05 07:01:09

可视化代码执行工具

2020-08-04 13:40:02

数据可视化热力图表格

2009-08-03 21:43:03

IT运维可视化摩卡

2020-03-11 14:39:26

数据可视化地图可视化地理信息

2021-04-27 08:57:58

开发技能代码

2023-09-15 14:39:09

2022-06-28 09:34:24

可视化Python代码

2015-12-08 11:39:59

JavaScript引擎指南

2021-07-12 17:23:47

零设计可视化引擎

2021-02-25 21:47:47

开源技术 趋势

2023-05-05 07:41:42

执行上下文JavaScript

2022-11-08 10:52:25

Flowable节点表单

2022-08-26 09:15:58

Python可视化plotly

2017-10-14 13:54:26

数据可视化数据信息可视化

2009-04-21 14:26:41

可视化监控IT管理摩卡

2021-11-24 08:51:32

Node.js监听函数

2020-10-22 15:15:25

SamplerShelLinux

2022-05-30 08:37:34

可视化图表项目开源
点赞
收藏

51CTO技术栈公众号