垃圾回收
JavaScript是使用垃圾回收的语言,也就是说执行环境负责在代码执行时管理内存。在C和C++等语言中,跟踪内存使用对开发者来说是很大的负担,也是很多问题的来源。JavaScript为开发者卸下了这个负担,通过自动内存管理实现内存分配和闲置资源回收。基本思路很简单:确定哪个变量不会再使用,然后释放它占用的内存。这个过程是周期性的,即垃圾回收程序每隔一定时间(或者说在代码执行过程中某个预定的收集时间)就会自动运行。垃圾回收过程是一个近似且不完美的方案,因为某块内存是否还有用,属于不可判定的
问题。意味着算法是解决不了的。
我们以函数中局部变量的正常生命周期为例。函数中的局部变量会在函数执行时存在。此时,栈(或者堆)内存会分配空间以保存相应的值。函数在内部使用了变量,然后退出。此时,就不再需要那个局部变量了,它占用的内存可以释放,供以后使用。这种情况下显然不再需要局部变量了,但并不是所有时候都会这么明显。垃圾回收程序必须跟踪记录哪个变量还会使用,以及哪个变量不会再使用,以便回收内存。如何标记未使用的变量也许有不同的实现方式。不过,在浏览器的发展史上,用到过两种主要的标记策略:标记清理
和引用计数
。
节选自JavaScript高级程序设计(第四版)第四章
1、引用计数(reference counting)
另一种不太常见的垃圾回收策略是引用计数。引用计数的含义是跟踪记录每个值被引用的次数。当声明了一个变量并将一个引用类型赋值给该变量时,则这个值的引用次数就是1。相反,如果包含对这个值引用的变量又取得了另外一个值,则这个值的引用次数就减1。当这个引用次数变成0时,则说明没有办法再访问这个值了,因而就可以将其所占的内存空间给收回来。这样,垃圾收集器下次再运行时,它就会释放那些引用次数为0的值所占的内存。
引用计数有个最大的问题: 循环引用。
举个🌰 A:
比如对象A有一个属性指向对象B,而对象B也有有一个属性指向对象A,这样相互引用.
function func() { let obj1 = {}; let obj2 = {}; obj1.a = obj2; // obj1 引用 obj2 obj2.a = obj1; // obj2 引用 obj1 } 复制代码
在这个例子中,objA和objB通过各自的属性相互引用;也就是说这两个对象的引用次数都是2。在采用引用计数的策略中,由于函数执行之后,这两个对象都离开了作用域,函数执行完成之后,objA和objB还将会继续存在,因为他们的引用次数永远不会是0。这样的相互引用如果说很大量的存在就会导致大量的内存泄露。
解决:手动解除引用
obj1.a = null; obj2.a = null; 复制代码
举个🌰 B:涉及COM对象的循环引用问题:
let element = document.getElementById('some_element') let myObject = new Object() myObject.element = element element.someObject = myObject 复制代码
这个例子在一个DOM对象(element)
和一个原生JavaScript对象(myObject)
之间制造了循环引用。myObject变量
有一个名为element
的属性指向DOM对象element
,而element对象
有一个someObject
属性指回myObject对象
.由于存在循环引用,因此DOM元素
的内存永远不会被回收,即使它已经被从页面上删除了也是如此。
为避免类似的循环引用问题,应该在确保不使用的情况下切断原生JavaScript对象
与DOM元素
之间的连接。比如,通过以下代码可以清除前面例子中建立的循环引用:
myObject.element = null element.someObject = null 复制代码
把变量设置为null实际上会切段变量与其之前引用值之间的关系。当下次垃圾回收程序运行时,这些值就会被删除,内存也会被回收。
注意⚠️:为了补救这点,IE9把BOM和DOM对象都改成了JavaScript对象,这同时也避免了由于存在两套垃圾回收算法而导致的问题,还消除了常见的内存泄漏现象。
2、标记清除(mark-and-sweep)
这是javascript中最常用的垃圾回收方式。当变量进入执行环境是,就标记这个变量为“进入环境”。从逻辑上讲,永远不能释放进入环境的变量所占用的内存,因为只要执行流进入相应的环境,就可能会用到他们。当变量离开环境时,则将其标记为“离开环境”。
垃圾收集器在运行的时候会给存储在内存中的所有变量都加上标记。然后,它会去掉环境中的变量以及被环境中的变量引用的标记。而在此之后再被加上标记的变量将被视为准备删除的变量,原因是环境中的变量已经无法访问到这些变量了。最后。垃圾收集器完成内存清除工作,销毁那些带标记的值,并回收他们所占用的内存空间。
标记清除也会遇到循环引用的问题。IE中有一部分对象并不是原生JavaScript对象。例如,其BOM和DOM中的对象就是使用C++以COM(Component Object Model,组件对象)对象的形式实现的,而COM对象的垃圾回收器就是采用的引用计数的策略。因此,即使IE的Javascript引擎使用标记清除的策略来实现的,但JavaScript访问的COM对象依然是基于引用计数的策略的。说白了,只要IE中涉及COM对象,就会存在循环引用的问题。
解决:手工断开js对象和DOM之间的链接。赋值为null。IE9把DOM和BOM转换成真正的JS对象了,所以避免了这个问题。
3、避免垃圾回收
通过上面内容了解了,浏览器虽然可以自动化执行垃圾回收,但如果项目比较大代码复杂,回收执行代价较大,某些情况甚至不能识别回收
1.数组array优化
将[]
赋值给一个数组对象,是清空数组的捷径(例如: arr = [];),但是需要注意的是,这种方式又创建了一个新的空对象,并且将原来的数组对象变成了一小片内存垃圾!实际上,将数组长度赋值为0(arr.length = 0)也能达到清空数组的目的,并且同时能实现数组重用,减少内存垃圾的产生。
2. 对象尽量复用
对象尽量复用,尤其是在循环等地方出现创建新对象,能复用就复用。不用的对象,尽可能设置为null,尽快被垃圾回收掉。
3.循环优化
在循环中的函数表达式,能复用最好放到循环外面。
4、避免内存泄漏
1.意外的全局变量
function fn(arg) { m = "this is a hidden global variable" } 复制代码
m
没被声明,会变成一个全局变量,在页面关闭之前不会被释放。
另一种意外的全局变量可能由 this
创建:
function fn() { this.variable = "potential accidental global" } // fn 调用自己,this 指向了全局对象(window) fn() 复制代码
在 JavaScript 文件头部加上 'use strict'
,可以避免此类错误发生。启用严格模式
解析 JavaScript ,避免意外的全局变量
。
2.被遗忘的计时器或回调函数
let someResource = getData() setInterval(function() { let node = document.getElementById('Node') if(node) { // 处理 node 和 someResource node.innerHTML = JSON.stringify(someResource)) } }, 1000) 复制代码
这样的代码很常见,如果id为Node的元素
从DOM中移除
,该定时器仍会存在,同时,因为回调函数中包含对someResource的引用
,定时器外面的someResource
也不会被释放。
所以要用完记住清除定时器鸭,也尽量别在定时器里引用dom对象。
3.闭包
function fn() { let m = document.createElement('xx') m.onClick = () => { // Even if it a empty function } } 复制代码
闭包可以维持函数内局部变量,使其得不到释放。
上例定义事件回调时,由于是函数内定义函数,并且内部函数 -> 事件回调引用外部函数,形成了闭包
解决办法:
// 1. 将事件处理函数定义在外面 function fn() { let m = document.createElement('xx') m.onClick = onClickFn() } // 2. 定义事件处理函数的外部函数中,删除对dom对象的引用 function fn() { let m = document.createElement('xx') m.onClick = () => { // Even if it a empty function } m = null } 复制代码
将事件处理函数定义在外部,解除闭包,或者在定义事件处理函数的外部函数中,删除对dom的引用。
4.没有清理的DOM元素引用
有时,保存 DOM 节点内部数据结构很有用。假如你想快速更新表格的几行内容,把每一行 DOM 存成字典(JSON 键值对)或者数组很有意义。此时,同样的 DOM 元素存在两个引用:一个在 DOM 树中
,另一个在字典中
。将来你决定删除这些行时,需要把两个引用都清除
。
let elements = { button: document.getElementById('button'), image: document.getElementById('image'), text: document.getElementById('text') } function doStuff() { image.src = 'http://some.url/image' button.click() console.log(text.innerHTML) } function removeButton() { document.body.removeChild(document.getElementById('button')) // 此时,仍旧存在一个全局的 #button 的引用 // elements 字典。button 元素仍旧在内存中,不能被 GC 回收。 } 复制代码
虽然我们用removeChild
移除了button
,但是还在elements对象
里保存着#button的引用
,换言之,DOM元素还在内存里面
。