说明
图解 Google V8 学习笔记
在编译流水线中的位置
先看三个例子:
1、在同一个任务中重复调用嵌套的 kaimo 函数。
function kaimo() { kaimo() } kaimo()
V8 会报栈溢出的错误:
2、使用 setTimeout 让 kaimo 函数在不同的任务中执行。
function kaimo() { console.log(1) setTimeout(kaimo, 0) } kaimo()
V8 能够正确执行。
3、在同一个任务中执行 kaimo 函数,但是却不是嵌套执行。
function kaimo() { console.log(1) return Promise.resolve().then(kaimo) } kaimo()
没有栈溢出的错误,页面却出现了卡死的情况。
这相当于在当前这一轮任务里不停地创建微任务,执行,创建,执行,创建……虽然不会爆栈,但也无法去执行下一个任务,主线程被卡在这里了,所以页面会卡死。
有同学说在执行5-10分钟后,Chrome会报错:paused before potential out-of-memory crash,然后当前宏任务继续处于被挂起状态。大家可以试一下,我试了好几次都是浏览器崩溃了,就很离谱。
V8 执行这三种不同代码时,它们的内存布局是不同的,而不同的内存布局又会影响到代码的执行逻辑。
为什么使用栈结构来管理函数调用?
通常函数有两个主要的特性:
- 函数可以被调用
- 函数具有作用域机制:作用域机制通常表现在函数执行时,会在内存中分配函数内部的变量、上下文等数据,在函数执行完成之后,这些内部数据会被销毁掉。
例子:
int getZ() { return 4; } int add(int x, int y) { int z = getZ(); return x + y + z; } int main() { int x = 5; int y = 6; int ret = add(x, y); }
上面这段 C 代码执行流程:
当 main 函数调用 add 函数时,需要将代码执行控制权交给 add 函数;
然后 add 函数又调用了 getZ 函数,于是又将代码控制权转交给 getZ 函数;
接下来 getZ 函数执行完成,需要将控制权返回给 add 函数;
同样当 add 函数执行结束之后,需要将控制权返还给 main 函数;
然后 main 函数继续向下执行。
函数调用示意图如下:
嵌套调用时函数的生命周期:
函数调用者的生命周期总是长于被调用者(后进),并且被调用者的生命周期总是先于调用者的生命周期结束 (先出)。
函数资源分配流程:
因为函数是有作用域机制的,站在函数资源分配和回收角度来看,被调用函数的资源分配总是晚于调用函数 (后进),而函数资源的释放则总是先于调用函数 (先出)。
函数的生命周期和函数的资源分配情况,它们都符合后进先出 (LIFO) 的策略,而栈结构正好满足这种后进先出 (LIFO) 的需求,所以选择栈来管理函数调用关系是一种很自然的选择。
栈如何管理函数调用?
栈的变化情况是怎样的?
当执行一个函数的时候,栈怎么变化?
例子:
int main() { int x = 5; int y = 6; x = 100; int z = x + y; return z; }
函数在执行过程中,其内部的临时变量会按照执行顺序被压入到栈中。
当一个函数调用另外一个函数时,栈的变化情况是怎样的?
int add(num1,num2){ int x = num1; int y = num2; int ret = x + y; return ret; } int main() { int x = 5; int y = 6; x = 100; int z = add(x,y); return z; }
快调用 add 函数时:
调用 add 函数的过程:
当 add 函数执行完成之后,需要将执行代码的控制权转交给 main 函数,这意味着需要将栈的状态恢复到 main 函数上次执行时的状态,我们把这个过程叫恢复现场。
怎么恢复 main 函数的执行现场呢?
栈顶指针是在栈操作过程中,有一个专门的栈指针(习惯上称它为TOP),指出栈顶元素所在的位置。
在寄存器中保存一个永远指向当前栈顶的指针即可。
栈顶指针的作用就是告诉你应该往哪个位置添加新元素,这个指针通常存放在 esp 寄存器中。如果你想往栈中添加一个元素,那么你需要先根据 esp 寄存器找到当前栈顶的位置,然后在栈顶上方添加新元素,新元素添加之后,还需要将新元素的地址更新到 esp 寄存器中。
所以当 add 函数执行结束时,只需要将栈顶指针向下移动,就可以恢复 main 函数的执行现场了。
add 函数即将执行结束的状态:
恢复 mian 函数执行现场:
CPU 是怎么知道要移动到这个地址呢?
CPU 的解决方法是增加了另外一个
ebp 寄存器
,用来保存当前函数的起始位置,我们把一个函数的起始位置也称为栈帧指针
,ebp 寄存器
中保存的就是当前函数的栈帧指针
。
ebp 寄存器保存了栈帧指针:
在 main 函数调用 add 函数的时候:
main 函数的栈顶指针就变成了 add 函数的栈帧指针
需要将 main 函数的栈顶指针保存到 ebp 中
当 add 函数执行结束之后:只需要取出 main 函数的栈顶指针写到 esp 中即可
需要销毁 add 函数的栈帧
并恢复 main 函数的栈帧
这就相当于将栈顶指针移动到 main 函数的区域。
如何恢复 main 函数的栈帧指针呢?
每个栈帧对应着一个未运行完的函数,栈帧中保存了该函数的返回地址和局部变量。栈帧也叫过程活动记录。
通常的方法是在 main 函数中调用 add 函数时,CPU 会将当前 main 函数的栈帧指针保存在栈中:
- 首先取出 ebp 中的指针,写入 esp 中
- 然后从栈中取出之前保留的 main 的栈帧地址,将其写入 ebp 中
这样 ebp 和 esp 就都恢复了,可以继续执行 main 函数了。
堆
和栈空间不同,存放在堆空间中的数据是不要求连续存放的,从堆上分配内存块没有固定模式的,你可以在任何时候分配和释放它。
下面代码中有 new int、new Point 这种语句,当执行这些语句时,表示要在堆中分配一块数据,然后返回指针,通常返回的指针会被保存到栈中。
struct Point { int x; int y; }; int main() { int x = 5; int y = 6; int *z = new int; *z = 20; Point p; p.x = 100; p.y = 200; Point *pp = new Point(); pp->y = 400; pp->x = 500; delete z; delete pp; return 0; }
当 main 函数快执行结束时,堆和栈的状态:
上图中 p 和 pp 都是地址,它们保存在栈中,指向了在堆中分配的空间。
- C/C++ 这种手动管理内存的语言,如果没有手动销毁堆中的数据,那么就会造成内存泄漏
- JavaScript,Java 使用了自动垃圾回收策略,可以实现垃圾自动回收,但也会带来一些性能问题