精读《JS 引擎基础之 Shapes and Inline Caches》

本文涉及的产品
云解析 DNS,旗舰版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
简介:

1 引言

本期精读的文章是:JS 引擎基础之 Shapes and Inline Caches

一起了解下 JS 引擎是如何运作的吧!

JS 的运作机制可以分为 AST 分析、引擎执行两个步骤:

0eede13eb5152742ec02b70a2f2083c6bbd7cdb8

JS 源码通过 parser(分析器)转化为 AST(抽象语法树),再经过 interperter(解释器)解析为 bytecode(字节码)。

为了提高运行效率,optimizing compiler(优化编辑器)负责生成 optimized code(优化后的机器码)。

本文主要从 AST 之后说起。

2 概述

JS 的解释器、优化器

JS 代码可能在字节码或者优化后的机器码状态下执行,而生成字节码速度很快,而生成机器码就要慢一些了。

e9df2960a706188fb77e4242b1c15bec163c7a44

V8 也类似,V8 将 interpreter 称为 Ignition(点火器),将 optimizing compiler 成为 TurboFan(涡轮风扇发动机)。

e005ddc9d3ed5c80c51e916d09086588b41d7be3

可以理解为将代码先点火启动后,逐渐进入涡轮发动机提速。

代码先快速解析成可执行的字节码,在执行过程中,利用执行中获取的数据(比如执行频率),将一些频率高的方法,通过优化编译器生成机器码以提速。

8a9bb76e60038494152b7d28ff460a762b76d4f8

火狐使用的 Mozilla 引擎有一点点不同,使用了两个优化编译器,先将字节码优化为部分机器码,再根据这个部分优化后的代码运行时拿到的数据进行最终优化,生成高度优化的机器码,如果优化失败将会回退到部分优化的机器码。

笔者:不同前端引擎对 JS 优化方式大同小异,后面会继续列举不同前端引擎在解析器、编译器部分优化的方式。

8948ae71a29302d89bc77541091320d90c89d4bd

微软的 Edge 浏览器,使用的 Chakra 引擎,优化方式与 Mozilla 很像,区别是第二个最终优化的编译器同时接收字节码和部分优化的机器码产生的数据,并且在优化失败后回退到第一步字节码而不是第二步。
f051ad775cd924a6a8c0c81a55b6ab1581bb903e

Safari、React Native 使用的 JSC 引擎则更为极端,使用了三个优化编译器,其优化是一步步渐进的,优化失败后都会回退到第一步部分优化的机器码。

为什么不同前端引擎会使用不同的优化策略呢?这是由于 JS 要么使用解释器快速执行(生成字节码),或者优化成机器码后再执行,但优化消耗时间的并不总是小于字节码低效运行损耗的时间,所以有些引擎选择了多个优化编译器,逐层优化,尽可能在解析时间与执行效率中找到一个平衡点。

JS 的对象模型

JS 是基于面向对象的,那么 JS 引擎是如何实现 JS 对象模型的呢?他们用了哪些技巧加速访问 JS 对象的属性?

和解析器、优化器一样,大部分主流 JS 引擎在对象模型实现上也很类似。

a24e05a5f6966622ab452e5c195327b8d1436299

ECMAScript 规范确定了对象模型就是一个以字符串为 key 的字典,除了其值以外,还定义了 Writeable Enumerable Configurable 这些配置,表示这个 key 能否被重写、遍历访问、配置。

虽然规范定义了 [[]] 双括号的写法,那这不会暴露给用户,暴露给用户的是 Object.getOwnPropertyDescriptor 这个 API,可以拿到某个属性的配置。


在 JS 中,数组是对象的特殊场景,相比对象,数组拥有特定的下标,根据 ECMAScript 规范规定,数组下标的长度最大为 2³²−1。同时数组拥有 length 属性:


46b622dc80e7c27cc789ca76a11adf9a17721c23

length 只是一个不可枚举、不可配置的属性,并且在数组赋值时,会自动更新数值:

efbab5591a1f6166b83bddd5ea114db7f9c5ffcc

所以数组是特殊的对象,结构完全一致。

属性访问效率优化

属性访问是最常见的,所以 JS 引擎必须对属性访问做优化。

Shapes

JS 编程中,给不同对象相同的 key 名很常见,访问不同对象的同一个 propertyKey 也很常见:

const object1 = { x: 1, y: 2 };
const object2 = { x: 3, y: 4 };

function logX(object) {
  console.log(object.x);
  //          ^^^^^^^^
}

logX(object1);
logX(object2);
这时  object1 与  object2 拥有一个相同的  shape。拿拥有  xy 属性的对象来看:
1df143534ebe261a228e196b6fe3a93268f0f1cd

如果访问 object.y,JS 引擎会先找到 key y,再查找 [[value]]

如果将属性值也存储在 JSObject 中,像 object1 object2 就会出现许多冗余数据,因此引擎单独存储 Shape,与真实对象隔离:

dcf1ae43369993b684167a15e474d55d38f1fffd

这样具有相同结构的对象可以共享 Shape。所有 JS 引擎都是用这种方式优化对象,但并不都称为 Shape,这里就不详细罗列了,可以去原文查看在各引擎中 Shape 的别名。

Transition chains 和 Transition trees

如果给一个对象增加了 key,JS 引擎如何生成新的 Shape 呢?

这种 Shape 链式创建的过程,称为 Transition chains:

3196af697d35fdaf10f6340aa4b2fc3fbf4d0b0c

开始创建空对象时,JSObject 和 Shape 都是空,当为 x 赋值 5 时,在 JSObject 下标 0 的位置添加了 5,并且 Shape 指向了拥有字段 xShape(x),当赋值 y6 时,在 JSObject 下标 1 的位置添加了 6,并将 Shape 指向了拥有字段 xyShape(x, y)

而且可以再优化,Shape(x, y) 由于被 Shape(x) 指向,所以可以省略 x 这个属性:

6ca4add8640847ad65a92ee33f15da73bfd9e782

笔者:当然这里说的主要是优化技巧,我们可以看出来,JS 引擎在做架构设计时没有考虑优化问题,而在架构设计完后,再回过头对时间和空间进行优化,这是架构设计的通用思路。

如果没有连续的父 Shape,比如分别创建两个对象:


const object1 = {};
object1.x = 5;
const object2 = {};
object2.y = 6;

这时要通过 Transition trees 来优化:

e987d854e543a5c40a62083cacc6a05a881e05c4

可以看到,两个 Shape(x) Shape(y) 别分继承 Shape(empty)。当然也不是任何时候都会创建空 Shape,比如下面的情况:


const object1 = {};
object1.x = 5;
const object2 = { x: 6 };

生成的  Shape 如下图所示:

589248c755ac985b588d0388575d625d37190709

可以看到,由于 object2 并不是从空对象开始的,所以并不会从 Shape(empty) 开始继承。

Inline Caches

大概可以翻译为“局部缓存”,JS 引擎为了提高对象查找效率,需要在局部做高效缓存。

比如有一个函数 getX,从 o.x 获取值:



function getX(o) {
  return o.x;
}

JSC 引擎 生成的字节码结构是这样的:

09973c8cac2ab957a91175515e601af3a5e93dd1

get_by_id 指令是获取 arg1 参数指向的对象 x,并存储在 loc0,第二步则返回 loc0

当执行函数 getX({ x: 'a' }) 时,引擎会在 get_by_id 指令中缓存这个对象的 Shape

06c8d827ad0d77929469e1d6927f97f84795d896

这个对象的 Shape 记录了自己拥有的字段 x 以及其对应的下标 offset

27c886383395099ca44e3ca2d5a5be98cfe7a9ac

执行 get_by_id 时,引擎从 Shape 查找下标,找到 x,这就是 o.x 的查找过程。但一旦找到,引擎就会将 Shape 保存的 offset 缓存起来,下次开始直接跳过 Shape 这一步:

c09ebd6e2236add6a0b3dd830c720e14c2934aee

以后访问 o.x 时,只要 Shape 相同,引擎直接从 get_by_id 指令中缓存的下标中可以直接命中要查找的值,而这个缓存在指令中的下标就是 Inline Cache.

数组存储优化

和对象一样,数组的存储也可以被优化,而由于数组的特殊性,不需要为每一项数据做完整的配置。

比如这个数组:



const array = ["#jsconfeu"];

JS 引擎同样通过  Shape  与数据分离的方式存储:

1ab59d6644a0584e21ce3e8a4f2092646cbc3ef9

JS 引擎将数组的值单独存储在 Elements 结构中,而且它们通常都是可读可配置可枚举的,所以并不会像对象一样,为每个元素做配置。

但如果是这种例子:


// 永远不要这么做
const array = Object.defineProperty([], "0", {
  value: "Oh noes!!1",
  writable: false,
  enumerable: false,
  configurable: false
});

JS 引擎会存储一个  Dictionary Elements 类型,为每个数组元素做配置:

8faa5a45c9b3eb8cb81d30810b87021c7e0d2e0b

这样数组的优化就没有用了,后续的赋值都会基于这种比较浪费空间的 Dictionary Elements 结构。所以永远不要用 Object.defineProperty 操作数组。

通过对 JS 引擎原理的认识,作者总结了下面两点代码中的注意事项:

  1. 尽量以相同方式初始化对象,因为这样会生成较少的 Shapes
  2. 不要混淆对象的 propertyKey 与数组的下标,虽然都是用类似的结构存储,但 JS 引擎对数组下标做了额外优化。

3 精读

这次原理系列解读是针对 JS 引擎执行优化这个点的,而网页渲染流程大致如下:


46add56a21064e4a2a10d48bf21f1d2f1f5cad22

可以看到 Script 在整个网页解析链路中位置是比较靠前的,JS 解析效率会直接影响网页的渲染,所以 JS 引擎通过解释器(parser)和优化器(optimizing compiler)尽可能 对 JS 代码提效。

Shapes

需要特别说明的是,Shapes 并不是 原型链,原型链是面向开发者的概念,而 Shapes 是面向 JS 引擎的概念。

比如如下代码:


const a = {};
const b = {};
const c = {};

显然对象 a b c 之间是没有关联的,但共享一个 Shapes。

另外理解引擎的概念有助于我们站在语法层面对立面的角度思考问题:在 JS 学习阶段,我们会执着于思考如下几种创建对象方式的异同:


const a = {};
const b = new Object();
const c = new f1();
const d = Object.create(null);

比如上面四种情况,我们要理解在什么情况下,用何种方式创建对象性能最优。

但站在 JS 引擎优化角度去考虑,JS 引擎更希望我们都通过 const a = {} 这种看似最没有难度的方式创建对象,因为可以共享 Shape。而与其他方式混合使用,可能在逻辑上做到了优化,但阻碍了 JS 引擎做自动优化,可能会得不偿失。

Inline Caches

对象级别的优化已经很极致了,工程代码中也没有机会帮助 JS 引擎做得更好,值得注意的是不要对数组使用 Object 对象下的方法,尤其是 defineProperty,因为这会让 JS 引擎在存储数组元素时,使用 Dictionary Elements 结构替代 Elements,而 Elements 结构是共享 PropertyDescriptor 的。

但也有难以避免的情况,比如使用 Object.defineProperty 监听数组变化时,就不得不破坏 JS 引擎渲染了。

笔者写 dob 的时候,使用 proxy 监听数组变化,这并不会改变 Elements 的结构,所以这也从另一个侧面证明了使用 proxy 监听对象变化比 Object.defineProperty 更优,因为 Object.defineProperty 会破坏 JS 引擎对数组做的优化。

4 总结


本文主要介绍了 JS 引擎两个概念: ShapesInline Caches,通过认识 JS 引擎的优化方式,在编程中需要注意以下两件事:

  1. 尽量以相同方式初始化对象,因为这样会生成较少的 Shapes
  2. 不要混淆对象的 propertyKey 与数组的下标,虽然都是用类似的结构存储,但 JS 引擎对数组下标做了额外优化。

原文发布时间为:2018年06月25日
原文作者:黄子毅
本文来源:  掘金  如需转载请联系原作者



相关文章
|
JavaScript 定位技术
原生 js 实现类 3d 地图大屏展示自动高亮轮播、显示悬浮提示 tootip 的方案:svg + popper.js 定位引擎
原生 js 实现类 3d 地图大屏展示自动高亮轮播、显示悬浮提示 tootip 的方案:svg + popper.js 定位引擎
336 0
原生 js 实现类 3d 地图大屏展示自动高亮轮播、显示悬浮提示 tootip 的方案:svg + popper.js 定位引擎
|
2月前
|
JavaScript 前端开发 Java
JS引擎V8
【10月更文挑战第9天】
29 0
|
4月前
|
Web App开发 JavaScript 前端开发
什么是JavaScript引擎
【8月更文挑战第14天】什么是JavaScript引擎
82 1
|
6月前
|
XML 缓存 JavaScript
一篇文章讲明白JS模板引擎之JST模板
一篇文章讲明白JS模板引擎之JST模板
54 2
|
7月前
|
JavaScript 前端开发 NoSQL
【MongoDB 专栏】MongoDB 的 JavaScript 引擎与脚本执行
【5月更文挑战第11天】MongoDB 的 JavaScript 引擎允许在服务器端直接执行脚本,提升效率并实现定制化操作。脚本环境提供独立但与数据库关联的运行空间,引擎负责脚本的解析、编译和执行。执行过程包括脚本提交、解析、编译和执行四个步骤。掌握脚本逻辑设计和 JavaScript 语言特性对于高效利用这一功能至关重要。例如,通过脚本可以计算商品总销售额,增强数据库操作的灵活性。
109 1
【MongoDB 专栏】MongoDB 的 JavaScript 引擎与脚本执行
|
6月前
|
缓存 自然语言处理 前端开发
深入剖析JavaScript引擎的工作原理
【6月更文挑战第3天】JavaScript引擎由解析器、解释器、优化器和垃圾回收器组成,它们协同完成代码的解析、编译和执行。解析器将源代码转为抽象语法树(AST),编译阶段进行作用域分析和变量提升。解释器执行AST,优化器在代码频繁执行时进行即时编译以提高性能。垃圾回收器自动回收不再使用的内存,防止泄漏。理解这些原理有助于优化代码和提升Web应用性能。
57 1
|
7月前
|
JavaScript 前端开发 开发者
Vue.js深度解析:前端开发的生产力引擎
Vue.js深度解析:前端开发的生产力引擎
103 0
|
JavaScript 前端开发 算法
带你读《现代Javascript高级教程》十一、JavaScript引擎的垃圾回收机制(1)
带你读《现代Javascript高级教程》十一、JavaScript引擎的垃圾回收机制(1)
|
JavaScript 前端开发 算法
带你读《现代Javascript高级教程》十一、JavaScript引擎的垃圾回收机制(2)
带你读《现代Javascript高级教程》十一、JavaScript引擎的垃圾回收机制(2)
|
Web App开发 自然语言处理 JavaScript
带你读《现代Javascript高级教程》十、JavaScript引擎的工作原理:代码解析与执行(1)
带你读《现代Javascript高级教程》十、JavaScript引擎的工作原理:代码解析与执行(1)