【JSConf EU 2018】WebAssembly 的手工艺术

简介: 在今年欧洲的JSConf上Emil Bay进行了一场题为《Hand-Crafting WebAssembly》的演讲。Emil表示:“现在已经有很多关于WebAssembly(WASM)的演讲。遗憾的是,大多数演讲是关于如何把高级语言编译成wasm的,他们把wasm当成一个半透明的盒子。

在今年欧洲的JSConf上Emil Bay进行了一场题为《Hand-Crafting WebAssembly》的演讲。Emil表示:“现在已经有很多关于WebAssembly(WASM)的演讲。遗憾的是,大多数演讲是关于如何把高级语言编译成wasm的,他们把wasm当成一个半透明的盒子。WebAssembly是一门有趣的语言,你可以用它写出性能低于C的代码”。在这此的演讲中,Emil向我们演示了如何写WAT(WebAssembly的文本格式)以及当拥有大内存时,如何推理算法,如何将高级结构(如循环)转换为基础指令,同时获得乐趣!Emil演示了如何把一些难度逐渐递增的算法转换成基础指令,在没有抽象的情况下每一个算法的实现都充满着挑战。即时你在工作中并没有使用WASM,学习计算机的最低级指令可以拨开抽象的迷雾,揭示计算机的神奇。在开始正文之前让我们先一睹大佬风采

什么是WebAssembly

“WebAssembly(缩写Wasm)是运行在一个基于栈的虚拟机上的二进制指令格式。Wasm是为了把像C/C++/Rust等高级语言编译成便携式的目标而设计的,可以被部署到Web端和服务端应用”。 这是WebAssembly官网的解释,听起来不错,但是今天我们可以忘记这些,因为我们今天用不到这些高深的技术术语。通过“WebAssembly”这个单词你可能猜想它运行在浏览器端的汇编语言。实际上,它既不是很Web,也不是很Assembly(Not very Web, not very Assembly)。

为什么这么说WebAssembly “Not very Web, not very Assembly”呢?

  • 它不能直接使用Web API。
  • WebAssembly代码不是直接运行在物理机上的,虽然它很接近物理机,但它仍然是一个抽象出来的运行环境。
  • 不能系统调用,除非你通过JavaScript给它调用通道。
  • 不能使用新的硬件设备。例如:蓝牙。
  • 没什么魔法,只是计算。

吐槽了那么多,到底WebAssembly是什么呢?

  • 64位整型(i64) WebAssembly最让我兴奋的的是它可以使用64位的整型数字,这让我们可以精确的描述那些需要数字计算的事物。由于我的工作是关于密码学的,我们经常需要处理256位或者512位长度的二进制数字,64位整型数字的支持对性能提升确实很有效。

  • 性能提升(Performance Boost) 人们通常通过把代码转换成WebAssembly来获得性能的提升,但是根据我的经验通常收益不像想象的那么大。我通过以前一些实验得出WebAssembly相对JavaScript性能大约提升了20%至30%。因为JavaScript在一些新的JavaScript引擎(v8、SipderMonkey等)上已经运行的很快了!

  • 精度/可预测性(Precision/Predictable) 使用JavaScript写代码的时候,你通常不知道写出来的代码性能怎么样,除非你研究过底层的虚拟机。使用WebAssembly你更接近代码的底层运行,所以代码的表现或性能将更加可预测。

  • Run anywhere 另一件,让人感到兴奋的的事是WebAssembly可能在不久以后成为唯一一个可以跨平台、跨端运行的语言。我已经看到有人在使用WebAssembly写Linux内核的项目,还有人在浏览器里加载WebAssembly模块。

WebAssembly不是什么未来的黑科技,现在丹麦已经有超过77%的浏览器支持,而全球也已经有超过73%的浏览器支持,而且Node.js 8.0以上也支持WebAssembly,所以你现在就可以使用它。

WebAssembly Text-format

下面我们要手撸WebAssembly,而不是通过高级程序语言编译成WebAssembly。 WebAssembly是一种二进制格式的低级(low level)类汇编语言,官方为了让人类能够阅读和编辑它,还提供了相应的文本格式(wat)。

1. 平方运算

从一个简单的平方计算的函数开始我们的第一个WebAssembly模块:


 $square
        (export "square")
        (param $x i32)
        (result i32)
        (return (i32.mul (get_local $x)
                         (get_local $x)))))


这里我们定义了一个平方运算的函数square,它接受一个你i32类型的参数,返回结果也是i32。通过这个模块我们应该注意到以下几点:

  • wat文本采用的是S-expressions的语法(类似LISP)。
  • 模块是WebAssembly的基本单位,这点和ES6的模块很像。
  • 标签(参数名、变量名和函数名)使用 $ 前缀声明。
  • 明确的类型,参数、变量、函数返回都有类型声明。
  • 运算操作是通过type.op形式的指令调用,type代表运算结果的类型,op是要做的运算操作。如:i32.mul表示要做乘法运算(mul),运算操作的结果的类型是i32(32位整型数字)。
  • 显示访问,当要使用一个变量时,我们需要显示访问。如:get_local $x,我们使用get_local显示访问了本地变量x

我们来看下这个模块是如何使用的?

  1. 将上面的“First module”保存到square.wat文件。你也可以从handcrafting-webassembly这个仓库直接克隆获取源码。

  2. 安装编译工具wabtwat2js

$ git clone --recursive https://github.com/WebAssembly/wabt
$ cd wabt
$ make  #cmake, git, make required
$ npm i -g wat2js

安装完成后将 /wabt/bin目录添加到系统的环境。mac是添加到*/etc/paths*文件。

3.生成wasm模块和JavaScript胶水代码文件

$ wat2wasm square.wat  #生成square.wasm文件
$ wat2js square.wat -o square.js  #生成加载wasm模块的CommonJS模块

4.使用wasm模块。新建
example.js,添加如下代码:

var wasm = require('./square.js');
console.log(wasm.exports.square(2));  // 4 

通过这个简单的WebAssembly小模块,我们应该已经掌握了WebAssembly文本格式一些基本语法以及如何使用它。接下来我们来看下Emil在实际工作中写的代码。

2. 计算两点之间距离

下面的这段代码定义并导出了一个f64.distance的函数,它接受四个参数分别是x1、y1、x2、y2,返回一个64位浮点型数字。这段代码还是比较好理解的,有了之前的“First Module”的经验你应该已经知道如何使用它。同样,你可以在handcrafting-webassembly找到它的源码。


(module 
    (func $square
        (export "square")
        (param $x i32)
        (result i32)
        (return (i32.mul (get_local $x)
                         (get_local $x))))

    (func $f64.distance
        (export "f64.distance")
        (param $x1 i32) (param $y1 i32)
        (param $x2 i32) (param $y2 i32)
        (result f64)
        
        (local $x.dist i32)
        (local $y.dist i32)
        
        (set_local $x.dist (i32.sub (get_local $x1)
                                    (get_local $x2)))
        
        (set_local $y.dist (i32.sub (get_local $y1)
                                    (get_local $y2)))
        
        (return (f64.sqrt (f64.convert_u/i32 (i32.add (call $square (get_local $x.dist))
                                   (call $square (get_local $y.dist)))))))
                                   
)

让我们把难度再提升一个等级。

3. 计算矢量间的距离

矢量间距离计算,其实相当于两个数组间距离的计算。这段代码的难度就增加了很多!这里用到了WebAssembly的线性内存(Linear memory)和loop指令。

  • memory是WebAssembly的一个重要的概念,它是用来实现JavaScript和WebAssebly模块间通信的,本质上就是一个大的共享数组。下面的模块中,我们创建并导出了一页(64KiB)大小的momery实例。导出的memory实例是提供给JavaScript使用。通过JavaScript把外部数组的数据存到memory,然后我们可以WebAssebly模块里访问它。
  • loop指令用来定义循环代码块。紧跟在loop指令后面需要定义一个标签,在这里我们定义的是“continue”。WebAssembly的循环和JavaScript有些不同。在JavaScript的循环里有continue和break两个分支。WebAssembly的循环比较像do-while循环,但它只有一个条件分支,当br_if条件为真的时候,继续执行指定标签的循环。
(module 
    (memory (export "memory") 1)

    (func $i8.distance
        (export "i8.distance")
        (param $v.ptr i32)
        (param $w.ptr i32)
        (param $len i32)
        (result f64)
        
        (local $distance.sq i32)
        (local $elm i32)
        (local $offset i32)
        
        (set_local $distance.sq (i32.const 0))
        
        (loop $continue
            ;; $elm = $w[$offset] - $v[$offset]
            (set_local $elm (i32.sub (i32.load8_u (i32.add (get_local $w.ptr)
                                                           (get_local $offset)))
                                     (i32.load8_u (i32.add (get_local $v.ptr)
                                                           (get_local $offset)))))
            ;; $distance.sq += $elm ** 2
            (set_local $distance.sq (i32.add (get_local $distance.sq)
                                             (i32.mul (get_local $elm)
                                                      (get_local $elm))))
            ;; $offset++ < $len ? continue : break
            (br_if $continue (i32.lt_u (tee_local $offset 
                                                 (i32.add (get_local $offset)
                                                          (i32.const 4))) ;; bytewidth of i32
                                       (get_local $len))))

    (return (f64.sqrt (f64.convert_u/i32 (get_local $distance.sq))))))


通过这个例子,我们来看下数字在memory里面是如何存储的。如下图,我们可以看到i8类型表示的是八个比特位(bit)整型数字,也就是一个字节(byte)。i32表示的是四个字节长度的整型数字,f64表示的是八个字节的浮点型数字。所以说memory其实就是一个字节数组。在JavaScript里面数字只有Number类型,我们也不需要关心数字在内存中是如何存储的,但是在WebAssembly里,你必须知道如何为一个数字分配合适它的内存(定义合适的类型)。

那我们是如何解析数组的呢?答案是通过指针(pointer)和数组的长度(length)。在这里指针也就相当于数组的下标(index),长度也就是数组分配的内存大小。

总结

通过手撸三个难度递增的的WebAssembly模块,对于理解WebAssembly在内存使用和运行机制应该有所收益。但是还是要提醒大家手撸WebAssembly并不符合它的设计初衷。演讲的最后阶段,Emil还介绍了自己加密算法库sodium-nativesodium-universal(广告时间 啊哈~),如果你感兴趣的话可以移步到他的gayhub。(完

原文发布时间为:2018年06月29日
本文作者: leyayun
本文来源:掘金  如需转载请联系原作者

相关文章
|
人工智能 机器人 人机交互
哥大华人开发人脸机器人,照镜子自主模仿人类表情超逼真
【4月更文挑战第3天】哥伦比亚大学研究人员开发了一款名为Emo的机器人,能观察并模仿人类面部表情,实现更自然的人机交互。Emo配备26个面部执行器和高分辨率摄像头,通过“自我建模”学习模仿表情,并能预测人类表情变化。这一创新有望改善人机理解和响应情绪的能力,应用于教育、医疗等领域,但也引发了关于情感依赖和伦理问题的讨论。
335 4
哥大华人开发人脸机器人,照镜子自主模仿人类表情超逼真
|
数据采集 存储 数据可视化
【python】python二手房数据抓取分析可视化(源码)【独一无二】
【python】python二手房数据抓取分析可视化(源码)【独一无二】
【python】python二手房数据抓取分析可视化(源码)【独一无二】
|
弹性计算 人工智能 云栖大会
云栖大会 | 弹性计算一手资料来啦!(持续更新中)
在这一年一度汇聚了全球数万开发者的云栖大会上有什么精彩的瞬间呢?让我们一起回顾阿里云弹性计算的专家们带来的激奋人心的技术演讲。
98867 12
|
存储 数据库 文件存储
掌握Django文件处理:一步步构建上传功能
掌握Django文件处理:一步步构建上传功能
161 3
|
网络协议 算法 程序员
网络必修课:以太网报文格式详解
嗨,大家好!今天,我要带大家深入了解以太网报文格式,这是现代网络通信的重要基础。无论你是网络工程师、开发者,还是对技术感兴趣的朋友,这篇文章都将为你揭开以太网的神秘面纱,让你更好地理解和应用这一关键技术。准备好了吗?让我们开始吧!
537 4
|
人工智能 监控 安全
巧用通义灵码助力护网面试
护网行动是公安部组织的网络安全评估活动,通过模拟攻防演练提升企事业单位安全防护能力。自2016年起,涉及单位逐年增加,网络安全已成为业务保障必需。行动分为红蓝两队,红队模拟攻击,蓝队负责防御。在面试中,蓝队工程师岗位分为初级、中级和高级,要求包括漏洞分析、应急响应和安全设备操作。通义灵码作为AI工具,可用于面试准备,如分析日志、撰写脚本和辅助报告撰写,提高应聘者表现。红队面试侧重实战经验,如渗透测试和漏洞利用,通义灵码也可在代码审查和策略规划上提供帮助。请遵守中国国家网络安全法!!!网络不是法外之地!!!
Pandoc——使用ZIP方式安装
Pandoc——使用ZIP方式安装
281 0
|
Java BI Linux
java医院信息系统his源码,集成相关医保、农合接口,同医保或农合无缝融合
系统特点: 1、 基于一体化公共基础数据平台设计,给医务工作者提供了完整的工作平台。 2、 实现了核算、临床、决策、服务信息一体化,简化了系统软、硬件结构,降低了系统开发、实施和维护成本,提高了系统的运行效率。 3、 同时集成相关医保、农合接口,同医保或农合无缝融合。 4、B/S架构,采用JAVA编程,支持跨平台部署应用(Windows Linux),足够满足一级综合医院(专科二级及以下医院500床)的日常业务应用。能完全满足各地相关医保工程定点医疗机构统一标准社保接口设计规范要求。
208 0
|
人工智能 开发者
基于LangChain的Prompt模板
LangChain是一个开源库,简化了基于LLM的AI应用开发,充当AI开发的万能适配器,抽象并整合了大语言模型(如OpenAI和文心)的交互。要使用LangChain,首先通过`pip install langchain`安装。示例展示了如何使用LangChain与OpenAI模型交互,包括直接调用OpenAI接口和使用LangChain接口。LangChain的提示词模板功能用于构建Prompt,提高与AI对话的效率。LangChainHub是一个资源库,提供模板、工作流和最佳实践,方便开发者发现和分享。本文介绍了LangChain的基本用法和其生态系统中的LangChainHub。
基于LangChain的Prompt模板
|
设计模式 人工智能 算法
Python ABC:应用场景和示例
Python ABC:应用场景和示例
351 3