ECMAScript 双月报告:findLast 提案成功进入到 Stage 4

简介: 本次会议中,findLast 提案成功进入到了 Stage 4,这是第二个由中国开发者推动进入到 Stage 4 的提案。另外,较受关注的 String Dedent 与 JSON.parse source text access 等提案也在本次会议中取得了阶段性进展。

从 Stage 3 进入到 Stage 4 有以下几个门槛:

  1. 必须编写与所有提案内容对应的 tc39/test262 测试,用于给各大 JavaScript 引擎和 transpiler 等实现检查与标准的兼容程度,并且 test262 已经合入了提案所需要的测试用例;
  2. 至少要有两个实现能够兼容上述 Test 262 测试,并发布到正式版本中;
  3. 发起了将提案内容合入正式标准文本 tc39/ecma262 的 Pull Request,并被 ECMAScript 编辑签署同意意见。

findFromLast

提案链接:https://tc39.es/proposal-array-find-from-last/index.html


这一提案为数组(Array 与 TypedArray)引入了两个新方法 findLastfindLastIndex,来支持从数组的结尾开始查找一个元素,以及它在数组中位于倒数第几项(如 -1、-2)。

我们知道 JavaScript 中 Array.find 方法会返回第一个符合条件的数组成员,如果我们想做的是获取最后一个符合条件的成员(如多次操作中取最后一次操作),就需要复制一个数组,调用 reverse 方法,然后才能进行搜索:

image.png

这意味着你需要额外创建一个数组并进行操作。

类似的,Array.findIndex 方法也会返回第一个符合条件的数组成员的索引,如果你希望获得最后一个符合条件成员的索引,也需要进行数组的复制和反转,然后配合数组的长度进行计算:

image.png

在第二处调用中,由于 findIndex 会在没有找到符合条件成员时返回 -1,此时就需要进行额外的处理。

基于此提案引入的方法,你可以使用符合直觉的方式来找到最后一个满足条件的成员:

image.png目前,我们已经可以在 Chrome 97 中使用这些 API 了。另外,现在也可以通过 core-js 和 es-shims 来使用这两个方法。


Stage 2 → Stage 3



提案从 Stage 2 进入到 Stage 3 有以下几个门槛:

  1. 撰写了包含提案所有内容的标准文本,并有指定的 TC39 成员审阅并签署了同意意见;
  2. ECMAScript 编辑签署了同意意见。

Symbol as WeakMap Keys


这一提案支持了在 WeakM提案链接:https://github.com/tc39/proposal-symbols-as-weakmap-keysap 中使用 Symbol 类型作为键,此前 WeakMap 中只允许对象类型作为键。这一特性实际上是为了允许在 Records 与 Tuples 数据类型中引用对象。

Records 与 Tuples 提案为 JavaScript 引入了两个新的数据类型,它们的特性是基于值比较来判断相等性,如对于两个 Tuple 的比较中, #[1, 2,3] === #[1, 2, 3] 是成立的,因为内部的成员值完全一致。然而,这一基于值比较的特性导致了无法在 Record 与 Tuple 中使用基于引用地址比较的对象类型。而如果我们能够在 WeakMap 中使用 Symbol 类型作为键,就可以在 Record 与 Tuple 中使用 Symbol 存放引用,间接地实现对象类型值的存储。

对于 Map 与 WeakMap 的差异,我们知道 Map 类型是通过两个数组来分别存储键和键值的,这两个数组对于其中对象类型键/键值的引用始终存在,从而导致即使已经不存在其它的引用也无法回收处理。因此,WeakMap 持有的引用为弱引用,在对象类型不存在其它引用时,能正确地执行能垃圾回收。

正是因为弱引用的要求,WeakMap 的键是无法枚举的,且需要是唯一的值。对象类型很好地满足了这个要求,两个完全一样的对象类型实际上也拥有着不同的引用。你肯定会想到 Symbol 也具有这种“唯一”的特性,这也是为何此提案想要允许 Symbol 作为WeakMap 的键。

同时,Symbol 也能够起到比对象类型更好的标识作用:

image.png


在 ECMAScript 中,Symbol 也有多种类型:

  1. Unique Symbol,比如我们通过 Symbol(description) 创建的 Symbol 就是全局唯一的值;
  2. Well-known Symbol,比如 Symbol.iterator,是预知的、在语言特性中广泛使用的 Symbol 值;
  3. Registered Symbol,比如我们通过 Symbol.for(description) 注册的 Symbol,同样也是全局唯一的值,但是每次获取的都是同一个 Symbol 值。

在提案的方案中,Unique Symbol 与 Well-known Symbol 都是可以作为 WeakMap 的键值的,但是 Registered Symbol 不能作为 WeakMap 的键值。这是因为 Registered Symbol 实际上是无法观测到垃圾回收的,而不能观测到垃圾回收的值类型作为 WeakMap Key 没有实际意义。而 Well-known Symbol 虽然也是实际意义上无法被垃圾回收,但是这些 Symbol 是一个确定的列表,无法动态添加删除,所以也被允许作为 WeakMap 键值。

JSON.parse source text access


提案链接:https://github.com/tc39/proposal-json-parse-with-source

JavaScript 中对 JSON 的自定义类型支持一直都不是特别全面,如 JSON.parse 中存在的大数精度丢失问题,以及 JSON.stringify 中无法转换 JSON 中不存在的类型(如函数、Date 等),而 Stringify replacer 的输出会被再次序列化等问题。


image.png为了解决 JSON.parse 中 reviver 函数的 val 参数是已经解析过(parsed)的值这一问题,此提案为 JSON.parse 的 reviver 函数引入了第三个参数 sourceText,以支持在 parse 过程中基于原来的值进行处理:


image.png

对于 JSON.stringify 的序列化问题,此提案新增了 JSON.rawJson 方法来在 JSON.stringify 的 replacer 序列化过程中标记已经完成序列化的 JSON 值,而不必被二次序列化:


image.png

Regular Expression Pattern Modifiers for ECMAScript


提案链接:https://github.com/tc39/proposal-regexp-modifiers

我们在使用正则表达式时,可以指定多种执行模式,包含 i(大小写通配),m(多行匹配),s(单行匹配),还有目前同样作为 TC39 提案的 x(增强模式,见对应的提案 RegExp X Mode)。但是这些模式均为全量应用,即只能对整个正则表达式启用,并不能控制只对于其中的某一个部分生效。

为了解决这一问题,RegExp Modifiers 提案为正则表达式引入了子表达式,来实现局部范围内的模式启用与禁用。最初此提案包括 self-bounded 与 unbounded 两种模式,unbounded 模式在 21 年 12 月的 TC39 会议上被移除,目前仅有 self-bounded 模式,即自约束。

自约束(self-bounded)的基础语法为 (?imsx-imsx:subexpression) ,其使用 - 来在子表达式作用域内启用或禁用 flag 对应的模式。如(?-i:A(?i:B)C) 匹配 ABCAbC,但是不能匹配 aBC  或 ABc,其使用示例如下:


image.png

Stage 1 → Stage 2



从 Stage 1 进入到 Stage 2 需要完成撰写包含提案所有内容的标准文本的初稿。

Duplicate named capturing groups


提案链接:https://github.com/tc39/proposal-duplicate-named-capturing-groups

在正则表达式中,我们可以使用捕获组(Capturing Group)来对匹配模式中的某一部分做独立的匹配,如 es+ 会匹配 essssesssss+ 代表匹配一次或更多),而使用匹配组,我们可以将 es 作为一个匹配部分,如 (es)+ 会匹配 es 以及  eseses  等。

我们也可以对捕获组进行命名,如 ?<name> 这样的形式,常见的一个场景是结合 str.match方法:

image.png

每个捕获组的命名都需要是唯一的,这就使得我们无法使用同名捕获组匹配一组联合模式,如日期格式还可能是 06-01-2022,我们希望能这么使用联合模式:

image.png

但由于捕获组的命名唯一约束,上面这个表达式是不合法的。

为了解决这一问题,此提案提出允许捕获组的命名不唯一,以此来支持如上面在联合模式中使用捕获组的场景。


String Dedent


提案链接:https://github.com/tc39/proposal-string-dedent

String dedent 提案在 21 年 9 月的 TC39 会议上从 Stage 0 进入到 Stage 1,它引入了 String.dedent 方法来优化多行模板字符串下的行首空格表现。

举例来说,如果我们希望生成多行顶格的字符串,可能会这么写:

image.png

image.png

虽然最终结果是正常的,但是这种使用方式会导致代码中与实际结果的字符串格式不一致,在缩进较深的情况下显得尤为怪异。

如果使用  String.dedent 方法,我们可以确保代码中与实际结果的格式一致:

image.png

String.dedent 的核心功能就是移除所有非空内容行的公共缩进,同时删除开头、结尾的文字换行符,来使模板字符串的代码与最终结果完全一致。

你也可以通过 Playground 进行更多尝试。



Stage 0 → Stage 1



从 Stage 0 进入到 Stage 1 有以下门槛:

  1. 找到一个 TC39 成员作为 champion 负责这个提案的演进;
  2. 明确提案需要解决的问题与需求和大致的解决方案;
  3. 有问题、解决方案的例子;
  4. 对 API 形式、关键算法、语义、实现风险等有讨论、分析。
    Stage 1 的提案会有可预见的比较大的改动,以下列出的例子并不代表提案最终会是例子中的语法、语义。


Import Reflection


提案链接:https://github.com/tc39/proposal-import-reflection

此提案的原名为 Evaluator Attributes 提案,在 2021 年 10 月会议上已进入到 Stage 1,本次属于更名的同时进行了提案内容的更新。

Import Reflection 提案为 import 语句支持了使用 as 关键字来声明导入反射属性(元数据)的能力,如:

image.png

这一标注会改变 import 语句的对于目标模块的执行方式,以此提案的主要驱动场景之一为例, 为 WebAssembly 模块指定额外的类型,如实例导入(WebAssembly.Instance)与模块导入(WebAssembly.Module)。

image.png

以上示例使用了 wasm-module 作为反射信息,以改变对一个已编译完毕(但尚未链接)的 WebAssembly 模块对象的导入行为。

与另外一个在 import 语法中引入新语法的提案 Import Assertion 对比,其在导入语句中新增了断言语法,使得我们可以将模块断言为指定的类型,来提高引擎对模块导入的处理效率。以派生自 Import Assertion 提案的 JSON Modules 提案为例,其语法大致如下:

image.png

对于 Import Assertion,不同的断言并不会影响其解析结果。这也是其与 Import Reflection 的核心差异之一。


Regular Expression Atomic Operators for ECMAScript


提案链接:https://github.com/tc39/proposal-regexp-atomic-operators

这一提案将为 ECMAScript 中的正则表达式引入新的原子操作符(Atomic Operators)支持,包括原子组 ?> 与占有式量词 n*+n++ 等,来解决正则表达式匹配时的回溯问题。

举例来说,正则表达式 /a(bc|b)c/ 能同时匹配到 abccabc,在前者中,我们依次匹配 a、bc、c,但对于 abc 的情况则并不完全符合直觉,我们依次匹配 a、bc,由于匹配到 bc 耗尽了字符串的剩余部分,导致剩下的正则表达式 c 无法进行匹配。此时执行会重新回到 (bc|b) 的位置,改为匹配 b,然后才匹配到 c。

也就是说,在这种联合模式匹配时,如果其中的某一种匹配模式会导致整个正则表达式匹配失败,那么实际执行时会重新回溯,尝试切换到另一种匹配模式,以尽可能完成对整个正则表达式的匹配。我们可以使用原子组将原来的表达式改写为 a(?>bc|b)c ,此时如果联合模式中的某一部分成功匹配上了,那么即使在后续执行过程中正则表达式匹配失败,也不会再次回到此联合模式尝试重新匹配。也就是说在这种模式下,abc 将不再会被匹配。

原子组的作用是在联合模式成功匹配时避免后续可能的回溯匹配,而占有式量词则用于在满足某些条件时才阻止回溯匹配,其可以被视为原子组的语法糖。如 atom*+ 等价于 (?>atom*)atom++ 等价于 (?>atom+)atom{n,m}+ 等价于 (?>atom{n,m}) 等。

Faster Promsie Adoption


提案链接:https://github.com/tc39/proposal-faster-promise-adoption

Promise 的优化一直是引擎与 JavaScript 开发者关注的重点问题之一。比如 V8 团队曾经对 await 的标准行为提议了优化,去除了一个多余的 Promise Wrap 即去除了一次多余的异步循环 Tick 以降低 await 行为的损耗。

而这次,同样也是期望降低特定场景下使用 Promise 时的 tick 次数:

image.png

比如对于上面这段代码片段,其中 outer 这个 Promise 会需要 2 轮 tick 才能转换为 "resolve" 状态。即当你在 Promise 构造器的 resolve 方法中返回另一个的 Promise inner 时(Promise.resolve(1)),它实际上会在下一个 tick 才调用这个 Promise inner 的 then 方法;然后在再下一个 tick 时将 Promise outer 的状态设置为 "resolve" 状态;再在下一次 tick 时才会执行 Promise outer 的 then 方法。

也就是说,上面这个代码片段相当于:

image.png

这在 async/await 已经非常流行的 JavaScript 来说,比如我们经常会写以下代码片段,带来额外 tick 的成本是非常可观的:

image.png


为了解决这一问题,这一提案提出让一个 promise 可以快速获得另外一个 promise 的状态,而无需额外 tick 周期的方案:

image.png

相关文章
|
存储 机器学习/深度学习 监控
ECMAScript 双月报告:TC39 2023年3月会议提案进度汇总
在本次会议中,共有 9 个提案实现了 Stage 推进,其中阿里巴巴主导的 AsyncContext 提案进入到了 Stage 2。另外,有 4 个提案成功进入到 Stage 1,包括 Promise.withResolvers 以及 Class Method Param Decorators 等此前就广受关注的内置方法和语法提案。Stage 2 → Stage 3当一个提案进入 Stage 3 
|
存储 监控 JavaScript
ECMAScript 双月报告:Async Context 提案成功进入到 Stage 1
ECMAScript 双月报告:Async Context 提案成功进入到 Stage 1
178 0
|
JavaScript 前端开发 算法
ECMAScript 双月报告:Intl.Enumeration 提案成功进入到 Stage 4
ECMAScript 双月报告:Intl.Enumeration 提案成功进入到 Stage 4
210 0
|
JavaScript 算法 前端开发
ECMAScript 双月报告:TC39 2022年12月会议提案进度汇总
在本次会议中,Intl.Enumeration 提案成功进入到 Stage 4,距离它在 2020 年 6 月的会议上进入到 Stage 1 已经过去了两年半的时间,其它备受关注的提案如 Explicit Resource Management 与 Set Methods也成功取得进展,进入到 Stage 3 阶段。Stage 3 → Stage 4从 Stage 3 进入到 Stage 4 有以
|
前端开发 JavaScript 算法
ECMAScript 双月报告:Array.fromAsync 进入 Stage 3
在本次 TC39 会议中,或许是由于在亚洲时区(东京时间)举办的原因,整体提交的提案数量较少,也仅有三个提案取得了阶段性进展。另外,本次会议中没有提案进入到 Stage 4 阶段。
272 0
|
JSON JavaScript 前端开发
关于ECMA、ECMAScript、TC39、ES、Stage等概念的科普
关于ECMA、ECMAScript、TC39、ES、Stage等概念的科普
359 0
关于ECMA、ECMAScript、TC39、ES、Stage等概念的科普
|
存储 JavaScript 前端开发
ECMAScript 双月报告:装饰器提案进入 Stage 3
ECMAScript 双月报告:装饰器提案进入 Stage 3
1063 0
|
JavaScript 前端开发 Cloud Native
我国首个 JS 语言提案在 ECMA 进入 Stage 3
近期,在 ECMA 标准化组织的 TC39 技术委员会上,阿里巴巴前端标准化小组与淘系技术提出的 JavaScript 标准提案《Error Cause》进入了 Stage 3,将开始在 JavaScript 引擎中开始实现,并在浏览器、Node.js 实验性实施,是中国首个推进到 EcmaScript 的语言,将成为官方标准的自主技术提案。
我国首个 JS 语言提案在 ECMA 进入 Stage 3
|
JavaScript 前端开发 API
ECMAScript 双月报告:Realms 提案进入 Stage 3(2021/07)
7月的 TC39 会议在上周结束了。这次的会议有如 private-in 等提案进入了 Stage 4,Realms、`Object.hasOwn` 等提案进入了 Stage 3,相信很快大家就可以在开发者版本的浏览器、最新版 Node.js 中见到这些 API 了。那么这些提案提供了什么样的能力,我们该如何使用?
ECMAScript 双月报告:Realms 提案进入 Stage 3(2021/07)
|
Web App开发 存储 JavaScript
ECMAScript 双月报告:Realms 提案大改仍没能进入 Stage3
今年因为疫情原因,TC39 的会议频率大为提升,而每一次的会议内容也分散了许多。但是关于提案的讨论热度并不会因为疫情降低,比如这次会议中备受关注的 Realms 提案经过了大改:Realms 在新的提案方案里 Realm 之间无法直接交换除了原始 JavaScript 值(number, string, bigint, symbol 等)和 Callable 以外的 JavaScript 值。
ECMAScript 双月报告:Realms 提案大改仍没能进入 Stage3