【JSConf EU 2018】WebAssembly 的手工艺术

简介: 在今年欧洲的JSConf上Emil Bay进行了一场题为《Hand-Crafting WebAssembly》的演讲。Emil表示:“现在已经有很多关于WebAssembly(WASM)的演讲。遗憾的是,大多数演讲是关于如何把高级语言编译成wasm的,他们把wasm当成一个半透明的盒子。

在今年欧洲的JSConf上Emil Bay进行了一场题为《Hand-Crafting WebAssembly》的演讲。Emil表示:“现在已经有很多关于WebAssembly(WASM)的演讲。遗憾的是,大多数演讲是关于如何把高级语言编译成wasm的,他们把wasm当成一个半透明的盒子。WebAssembly是一门有趣的语言,你可以用它写出性能低于C的代码”。在这此的演讲中,Emil向我们演示了如何写WAT(WebAssembly的文本格式)以及当拥有大内存时,如何推理算法,如何将高级结构(如循环)转换为基础指令,同时获得乐趣!Emil演示了如何把一些难度逐渐递增的算法转换成基础指令,在没有抽象的情况下每一个算法的实现都充满着挑战。即时你在工作中并没有使用WASM,学习计算机的最低级指令可以拨开抽象的迷雾,揭示计算机的神奇。在开始正文之前让我们先一睹大佬风采

什么是WebAssembly

“WebAssembly(缩写Wasm)是运行在一个基于栈的虚拟机上的二进制指令格式。Wasm是为了把像C/C++/Rust等高级语言编译成便携式的目标而设计的,可以被部署到Web端和服务端应用”。 这是WebAssembly官网的解释,听起来不错,但是今天我们可以忘记这些,因为我们今天用不到这些高深的技术术语。通过“WebAssembly”这个单词你可能猜想它运行在浏览器端的汇编语言。实际上,它既不是很Web,也不是很Assembly(Not very Web, not very Assembly)。

为什么这么说WebAssembly “Not very Web, not very Assembly”呢?

  • 它不能直接使用Web API。
  • WebAssembly代码不是直接运行在物理机上的,虽然它很接近物理机,但它仍然是一个抽象出来的运行环境。
  • 不能系统调用,除非你通过JavaScript给它调用通道。
  • 不能使用新的硬件设备。例如:蓝牙。
  • 没什么魔法,只是计算。

吐槽了那么多,到底WebAssembly是什么呢?

  • 64位整型(i64) WebAssembly最让我兴奋的的是它可以使用64位的整型数字,这让我们可以精确的描述那些需要数字计算的事物。由于我的工作是关于密码学的,我们经常需要处理256位或者512位长度的二进制数字,64位整型数字的支持对性能提升确实很有效。

  • 性能提升(Performance Boost) 人们通常通过把代码转换成WebAssembly来获得性能的提升,但是根据我的经验通常收益不像想象的那么大。我通过以前一些实验得出WebAssembly相对JavaScript性能大约提升了20%至30%。因为JavaScript在一些新的JavaScript引擎(v8、SipderMonkey等)上已经运行的很快了!

  • 精度/可预测性(Precision/Predictable) 使用JavaScript写代码的时候,你通常不知道写出来的代码性能怎么样,除非你研究过底层的虚拟机。使用WebAssembly你更接近代码的底层运行,所以代码的表现或性能将更加可预测。

  • Run anywhere 另一件,让人感到兴奋的的事是WebAssembly可能在不久以后成为唯一一个可以跨平台、跨端运行的语言。我已经看到有人在使用WebAssembly写Linux内核的项目,还有人在浏览器里加载WebAssembly模块。

WebAssembly不是什么未来的黑科技,现在丹麦已经有超过77%的浏览器支持,而全球也已经有超过73%的浏览器支持,而且Node.js 8.0以上也支持WebAssembly,所以你现在就可以使用它。

WebAssembly Text-format

下面我们要手撸WebAssembly,而不是通过高级程序语言编译成WebAssembly。 WebAssembly是一种二进制格式的低级(low level)类汇编语言,官方为了让人类能够阅读和编辑它,还提供了相应的文本格式(wat)。

1. 平方运算

从一个简单的平方计算的函数开始我们的第一个WebAssembly模块:


 $square
        (export "square")
        (param $x i32)
        (result i32)
        (return (i32.mul (get_local $x)
                         (get_local $x)))))


这里我们定义了一个平方运算的函数square,它接受一个你i32类型的参数,返回结果也是i32。通过这个模块我们应该注意到以下几点:

  • wat文本采用的是S-expressions的语法(类似LISP)。
  • 模块是WebAssembly的基本单位,这点和ES6的模块很像。
  • 标签(参数名、变量名和函数名)使用 $ 前缀声明。
  • 明确的类型,参数、变量、函数返回都有类型声明。
  • 运算操作是通过type.op形式的指令调用,type代表运算结果的类型,op是要做的运算操作。如:i32.mul表示要做乘法运算(mul),运算操作的结果的类型是i32(32位整型数字)。
  • 显示访问,当要使用一个变量时,我们需要显示访问。如:get_local $x,我们使用get_local显示访问了本地变量x

我们来看下这个模块是如何使用的?

  1. 将上面的“First module”保存到square.wat文件。你也可以从handcrafting-webassembly这个仓库直接克隆获取源码。

  2. 安装编译工具wabtwat2js

$ git clone --recursive https://github.com/WebAssembly/wabt
$ cd wabt
$ make  #cmake, git, make required
$ npm i -g wat2js

安装完成后将 /wabt/bin目录添加到系统的环境。mac是添加到*/etc/paths*文件。

3.生成wasm模块和JavaScript胶水代码文件

$ wat2wasm square.wat  #生成square.wasm文件
$ wat2js square.wat -o square.js  #生成加载wasm模块的CommonJS模块

4.使用wasm模块。新建
example.js,添加如下代码:

var wasm = require('./square.js');
console.log(wasm.exports.square(2));  // 4 

通过这个简单的WebAssembly小模块,我们应该已经掌握了WebAssembly文本格式一些基本语法以及如何使用它。接下来我们来看下Emil在实际工作中写的代码。

2. 计算两点之间距离

下面的这段代码定义并导出了一个f64.distance的函数,它接受四个参数分别是x1、y1、x2、y2,返回一个64位浮点型数字。这段代码还是比较好理解的,有了之前的“First Module”的经验你应该已经知道如何使用它。同样,你可以在handcrafting-webassembly找到它的源码。


(module 
    (func $square
        (export "square")
        (param $x i32)
        (result i32)
        (return (i32.mul (get_local $x)
                         (get_local $x))))

    (func $f64.distance
        (export "f64.distance")
        (param $x1 i32) (param $y1 i32)
        (param $x2 i32) (param $y2 i32)
        (result f64)
        
        (local $x.dist i32)
        (local $y.dist i32)
        
        (set_local $x.dist (i32.sub (get_local $x1)
                                    (get_local $x2)))
        
        (set_local $y.dist (i32.sub (get_local $y1)
                                    (get_local $y2)))
        
        (return (f64.sqrt (f64.convert_u/i32 (i32.add (call $square (get_local $x.dist))
                                   (call $square (get_local $y.dist)))))))
                                   
)

让我们把难度再提升一个等级。

3. 计算矢量间的距离

矢量间距离计算,其实相当于两个数组间距离的计算。这段代码的难度就增加了很多!这里用到了WebAssembly的线性内存(Linear memory)和loop指令。

  • memory是WebAssembly的一个重要的概念,它是用来实现JavaScript和WebAssebly模块间通信的,本质上就是一个大的共享数组。下面的模块中,我们创建并导出了一页(64KiB)大小的momery实例。导出的memory实例是提供给JavaScript使用。通过JavaScript把外部数组的数据存到memory,然后我们可以WebAssebly模块里访问它。
  • loop指令用来定义循环代码块。紧跟在loop指令后面需要定义一个标签,在这里我们定义的是“continue”。WebAssembly的循环和JavaScript有些不同。在JavaScript的循环里有continue和break两个分支。WebAssembly的循环比较像do-while循环,但它只有一个条件分支,当br_if条件为真的时候,继续执行指定标签的循环。
(module 
    (memory (export "memory") 1)

    (func $i8.distance
        (export "i8.distance")
        (param $v.ptr i32)
        (param $w.ptr i32)
        (param $len i32)
        (result f64)
        
        (local $distance.sq i32)
        (local $elm i32)
        (local $offset i32)
        
        (set_local $distance.sq (i32.const 0))
        
        (loop $continue
            ;; $elm = $w[$offset] - $v[$offset]
            (set_local $elm (i32.sub (i32.load8_u (i32.add (get_local $w.ptr)
                                                           (get_local $offset)))
                                     (i32.load8_u (i32.add (get_local $v.ptr)
                                                           (get_local $offset)))))
            ;; $distance.sq += $elm ** 2
            (set_local $distance.sq (i32.add (get_local $distance.sq)
                                             (i32.mul (get_local $elm)
                                                      (get_local $elm))))
            ;; $offset++ < $len ? continue : break
            (br_if $continue (i32.lt_u (tee_local $offset 
                                                 (i32.add (get_local $offset)
                                                          (i32.const 4))) ;; bytewidth of i32
                                       (get_local $len))))

    (return (f64.sqrt (f64.convert_u/i32 (get_local $distance.sq))))))


通过这个例子,我们来看下数字在memory里面是如何存储的。如下图,我们可以看到i8类型表示的是八个比特位(bit)整型数字,也就是一个字节(byte)。i32表示的是四个字节长度的整型数字,f64表示的是八个字节的浮点型数字。所以说memory其实就是一个字节数组。在JavaScript里面数字只有Number类型,我们也不需要关心数字在内存中是如何存储的,但是在WebAssembly里,你必须知道如何为一个数字分配合适它的内存(定义合适的类型)。

那我们是如何解析数组的呢?答案是通过指针(pointer)和数组的长度(length)。在这里指针也就相当于数组的下标(index),长度也就是数组分配的内存大小。

总结

通过手撸三个难度递增的的WebAssembly模块,对于理解WebAssembly在内存使用和运行机制应该有所收益。但是还是要提醒大家手撸WebAssembly并不符合它的设计初衷。演讲的最后阶段,Emil还介绍了自己加密算法库sodium-nativesodium-universal(广告时间 啊哈~),如果你感兴趣的话可以移步到他的gayhub。(完

原文发布时间为:2018年06月29日
本文作者: leyayun
本文来源:掘金  如需转载请联系原作者

相关文章
|
3月前
|
Linux 开发者 iOS开发
跨界英雄Python:一招搞定跨平台兼容性难题🎯
【10月更文挑战第2天】Python 作为一种现代且灵活的编程语言,在处理跨平台兼容性方面表现出色。其标准库如 `os` 和 `pathlib` 以及第三方库使开发者能轻松编写高可移植性的代码。通过文件系统操作、执行外部命令及使用 Tkinter 创建 GUI 等示例,Python 展现了其强大的跨平台能力,让开发者专注于业务逻辑而非平台差异。掌握这些技巧,你将能在不同操作系统间游刃有余。
49 4
|
5月前
|
Rust 前端开发 JavaScript
震惊!JavaScript 与 WebAssembly 强强联合,开启前端性能传奇之旅,你准备好了吗?
【8月更文挑战第27天】在互联网飞速发展的今天,前端技术,特别是核心语言JavaScript,正经历着持续的革新。为了突破JavaScript在处理复杂计算时的性能局限,WebAssembly应运而生。作为一种高效的二进制格式,WebAssembly能以接近原生的速度在浏览器中运行,支持C、C++和Rust等语言编写的高性能代码。它与JavaScript相辅相成,前者专注于高性能计算任务(如游戏开发、图像处理),后者则负责页面的交互与逻辑控制。通过结合使用,二者为前端开发者提供了更为强大和灵活的工具集,共同推动前端技术进入一个全新的性能时代。
117 2
|
5月前
|
XML 开发框架 .NET
.NET框架:软件开发领域的瑞士军刀,如何让初学者变身代码艺术家——从基础架构到独特优势,一篇不可错过的深度解读。
【8月更文挑战第28天】.NET框架是由微软推出的统一开发平台,支持多种编程语言,简化应用程序的开发与部署。其核心组件包括公共语言运行库(CLR)和类库(FCL)。CLR负责内存管理、线程管理和异常处理等任务,确保代码稳定运行;FCL则提供了丰富的类和接口,涵盖网络、数据访问、安全性等多个领域,提高开发效率。此外,.NET框架还支持跨语言互操作,允许开发者使用C#、VB.NET等语言编写代码并无缝集成。这一框架凭借其强大的功能和广泛的社区支持,已成为软件开发领域的重要工具,适合初学者深入学习以奠定职业生涯基础。
122 1
|
6月前
|
自然语言处理 算法 安全
编程之道:从代码到艺术
在数字时代的浪潮中,编程已不仅是一项技术活动,它更是一种创造与表达的艺术。本文将通过探索编程的深层意义,揭示如何将枯燥的代码转化为充满创造力的作品。我们将一同走进编程的世界,感受逻辑与美学的交融,体验问题解决的快乐,并最终理解编程如何影响我们的生活与思维。
|
5月前
|
算法 搜索推荐
编程之道:从代码到艺术的探索
在数字时代的浪潮中,编程已不仅是一项技能,它逐渐演变成一种艺术。本文将通过个人的技术感悟,探讨如何从基础的代码编写,逐步深入到编程的艺术境界。我们将一起探索编程背后的思考方式、解决问题的策略,以及如何通过技术实现创造性的解决方案。文章旨在为读者揭示编程之美,鼓励更多技术人员以艺术家的心态去探索和实践。
40 0
|
6月前
|
数据库连接 数据库 Python
惊!Python 上下文管理器竟能如此 DIY,你的代码管理从此焕然一新🎉
【7月更文挑战第3天】Python的上下文管理器是资源管理的关键,保证了如文件或数据库连接的适时打开和关闭,提升代码可读性和可靠性。使用`with`语句结合`__enter__`和`__exit__`方法能简洁地处理异常和资源释放,例如在文件操作中,避免了手动关闭文件的需要。这降低了出错风险,使代码更整洁。
37 0
|
8月前
|
算法 vr&ar UED
硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎
【5月更文挑战第16天】美国四所顶级高校联合推出PhysDreamer,将物理引擎集成到视频生成模型,以实现更真实的3D对象动态交互。该技术利用动态先验知识估计物体物理属性,生成逼真的动态视频。实验显示PhysDreamer在动态逼真度上超越现有方法,但在计算成本和处理复杂物理交互方面仍有局限。研究团队对未来持乐观态度,期待改善效率并扩展应用范围。这一创新将推动虚拟体验技术的发展,增强VR/AR的沉浸感和多领域应用。[论文链接](https://arxiv.org/pdf/2404.13026.pdf)
77 2
|
前端开发 JavaScript
Primordial Farm(初元农场)星球生态游戏开发源代码部署流程
Primordial Farm(初元农场)星球生态游戏开发源代码部署流程
|
机器学习/深度学习 JavaScript 前端开发
微软行星云计算Planetary Computer——定了用python作为主要语言,告别GEE的JavaScript痛苦!
微软行星云计算Planetary Computer——定了用python作为主要语言,告别GEE的JavaScript痛苦!
421 0
微软行星云计算Planetary Computer——定了用python作为主要语言,告别GEE的JavaScript痛苦!
|
机器学习/深度学习 人工智能 机器人
新年快到了,让我们一起用Python编织中国结吧
新年快到了,让我们一起用Python编织中国结吧
316 0
新年快到了,让我们一起用Python编织中国结吧