高性能且小巧的脚本语言 LuaJIT

简介: Just-In-Time or JIT 是指在程序运行时进行代码编译的技术,像 Java,Python(这里指PyPy)、LuaJIT 都引入了这种技术。

网络异常,图片无法展示
|

What's JIT?

Just-In-Time or JIT 是指在程序运行时进行代码编译的技术,像 Java,Python(这里指PyPy)、LuaJIT 都引入了这种技术。

一般 JIT 编译器与解释器一同工作,大部分时间代码由解释器进行转换成机器码进行运行,当某些代码运行的次数超过设定的阈值时,就会触发 JIT 编译进行工作,JIT 编译器会把这些热点代码编译为机器码,当下次运行到这些代码时,就不用解析器进行解释转换了,可以直接运行机器码来提高程序的运行速度。


How does work of LuaJIT?

顾名思义,LuaJIT 是一种即时(JIT) 编译器。这意味着函数是按需编译的,即当它们首先运行时。这既确保了应用程序的快速启动,也有助于避免无用的工作。例如,未使用的函数根本不会被编译。

另一种编译方法称为提前(AOT) 编译。这里所有的东西都是在运行任何函数之前编译的。这是许多语言的经典方式,例如 C、C++、Go、Rust 等等。

当启动 LuaJIT 时,一切都像在标准 Lua 中一样进行:初始化 Lua 核心,加载标准库并分析命令行。然后通常会加载第一个 Lua 源代码文件并将其转换为 Lua 字节码。最后运行初始主块的函数......

example.lua:

local s = "hello,world!"
for i=1,10000 do
    for j=1,10000 do
        string.find(s, "ll", 1, true)
    end
end

上面代码中,它会被先转换成 LuaJIT 自己定义的字节码,我们可以用下面的命令来查看:

$ luajit -bl example.lua
-- BYTECODE -- example.lua:0-8
0001    KSTR     0   0      ; "hello,world!"
0002    KSHORT   1   1
0003    KSHORT   2 10000
0004    KSHORT   3   1
0005    FORI     1 => 0019
0006 => KSHORT   5   1
0007    KSHORT   6 10000
0008    KSHORT   7   1
0009    FORI     5 => 0018
0010 => GGET     9   1      ; "string"
0011    TGETS    9   9   2  ; "find"
0012    MOV     10   0
0013    KSTR    11   3      ; "ll"
0014    KSHORT  12   1
0015    KPRI    13   2
0016    CALL     9   1   5
0017    FORL     5 => 0010
0018 => FORL     1 => 0006
0019 => RET0     0   1

然后这些字节码再交给解释器去执行,当执行达到阈值设定时,就会触发 JIT 编译器的工作,LuaJIT 会先将它转换成 IR 中间码,然后转换成对应平台的机器码


Not Yet Implemented

在 LuaJIT 中,当 JIT 编译器编译成功后就会生成一个 trace 类型的 GC 对象,但是并不是所有的代码 LuaJIT 都能够成功编译。

当 LuaJIT 遇到不支持的函数或代码(一般叫它:NYI)时,就会中止当前的编译工作,重新回退到解释器执行的模式去。

例如上面的 string.find() 函数,只有 LuaJIT 2.1 以上的版本才支持,我们可以执行添加 -jv 选项来显示有关 JIT 编译器进度的详细信息。

$ luajit -v
LuaJIT 2.0.5 -- Copyright (C) 2005-2017 Mike Pall. http://luajit.org/
$ luajit -jv example.lua
[TRACE --- example.lua:4 -- NYI: FastFunc string.find at example.lua:5]

当 LuaJIT 版本为 2.0.5 时,就会提示你 NYI: FastFunc string.find at example.lua:5,意思就是说LuaJIT 编译器不支持编译 example.lua 文件的第 5 行代码,第 5 行代码就是 string.find(s, "ll", 1, true)

当我们切换到 luajit-2.1.0-beta3 后,再执行看看:

$ luajit-2.1.0-beta3 -jv example.lua
[TRACE   1 example.lua:4 loop]
[TRACE   2 (1/3) example.lua:3 -> 1]

TRACE 后面接着是数字,说明 JIT 编译成功了

How does maintain speed of LuaJIT?

要保证 LuaJIT 的运行速度时,就要避免使用 NYI 函数,如果调用 C 函数的话,尽量使用 LuaJIT 的 ffi 库来调用 C 函数。

尽量保持使用最新的 LuaJIT 版本,LuaJIT 的 2.1 版本加入了很多原先不支持的 NYI 函数,例如 string.find() 等,所以尽量使用最新版本来提升可被 JIT 编译的函数的数量。

如果需要使用 NYI 函数时,可以去看看网上或 OpenResty 中有没有对应替代函数。

Speed Test between JIT and None-JIT

那么,有 JIT 和没有 JIT 之间的速度差异到底有大呢?

由于 LuaJIT 2.0.5 的 JIT 不支持 string.find(),不会触发 JIT 的编译工作,所以我们可以用上面的代码,然后用 LuaJIT 2.0.5LuaJIT 2.1.0-beta3 分别来执行测试下有 JIT 和 没有 JIT 之间代码执行的速度:

example.lua:

local s = "hello,world!"
for i=1,10000 do
    for j=1,10000 do
        string.find(s, "ll", 1, true)
    end
end

LuaJIT 2.0.5 的执行速度:

# 第一次测试
$ time luajit-2.0.5 example.lua
luajit-2.0.5 example.lua  2.14s user 0.00s system 99% cpu 2.140 total
# 第二次测试
$ time luajit-2.0.5 example.lua
luajit-2.0.5 example.lua  2.17s user 0.00s system 99% cpu 2.169 total
# 第三次测试
$ time luajit-2.0.5 example.lua
luajit-2.0.5 example.lua  2.17s user 0.00s system 99% cpu 2.176 total

LuaJIT 2.1.0-beta3 的执行速度:

# 第一次测试
$ time luajit-2.1.0-beta3 example.lua
luajit-2.1.0-beta3 example.lua  0.03s user 0.00s system 99% cpu 0.026 total
# 第二次测试
$ time luajit-2.1.0-beta3 example.lua
luajit-2.1.0-beta3 example.lua  0.02s user 0.00s system 99% cpu 0.024 total
# 第三次测试
$ time luajit-2.1.0-beta3 example.lua
luajit-2.1.0-beta3 example.lua  0.03s user 0.00s system 99% cpu 0.026 total

可以看到,两个的速度相差了差不多 100 倍

目录
相关文章
|
弹性计算 运维 监控
|
存储 SQL 分布式计算
浅谈MPP数据库-Vertica
用过这块数据库3年时间,很多功能非常强大,POC做了很多数据库,查询性能可以说是最好的,推荐一下
2992 2
|
SQL NoSQL Java
信创迁移适配预研-SpringBoot连接达梦数据库DM8服务并在IDEA中连接
信创迁移适配预研-SpringBoot连接达梦数据库DM8服务并在IDEA中连接
2233 0
信创迁移适配预研-SpringBoot连接达梦数据库DM8服务并在IDEA中连接
|
8月前
|
自然语言处理 JavaScript 前端开发
当面试官再问我JS闭包时,我能答出来的都在这里了。
闭包(Closure)是前端面试中的高频考点,广泛应用于函数式编程中。它不仅指函数内部定义的函数,还涉及内存管理、作用域链和垃圾回收机制。闭包可以让函数访问其外部作用域的变量,但也可能引发内存泄漏等问题。通过合理使用闭包,可以实现模块化、高阶函数和回调函数等应用场景。然而,滥用闭包可能导致代码复杂度增加、调试困难以及潜在的性能问题。为了避免这些问题,开发时应谨慎处理闭包,避免不必要的嵌套,并及时清理不再使用的变量和监听器。
371 16
当面试官再问我JS闭包时,我能答出来的都在这里了。
|
11月前
|
Web App开发 JavaScript 前端开发
ThreeJs-01开发环境搭建
【11月更文挑战第12天】本指南介绍了如何使用 Node.js 和 npm 创建一个基本的 Three.js 项目。首先安装 Node.js 和 npm,然后创建项目目录并初始化项目,接着安装 Three.js 库,最后创建一个简单的 HTML 文件来测试 Three.js 的功能,确保一切正常运行。
549 54
|
Linux C语言 Python
perf_event_open 学习 —— 通过read的方式读取硬件技术器
perf_event_open 学习 —— 通过read的方式读取硬件技术器
|
11月前
|
存储 Linux Android开发
开源!时间管理大师必备工具
【10月更文挑战第13天】
739 3
|
Java API
JDK8到JDK25版本升级的新特性问题之使用Collectors.teeing()来计算一个列表中学生的平均分和总分如何操作
JDK8到JDK25版本升级的新特性问题之使用Collectors.teeing()来计算一个列表中学生的平均分和总分如何操作
|
人工智能 双11
淘宝设计2023年度AI设计实践报告(中)
淘宝设计2023年度AI设计实践报告(中)
499 3