我研究JavaScript閉包(closure)已經有一段時間了。我之前只是學會瞭如何使用它們,而沒有透徹地了解它們具體是如何運作的。那麼,究竟什麼是閉包呢?
Wikipedia給出的解釋並沒有太大的幫助。閉包是什麼時候被創造出來的,什麼時候被銷毀的?具體的實現又是怎麼樣的?
"use strict"; var myClosure = (function outerFunction() { var hidden = 1; return { inc: function innerFunction() { return hidden++; } }; }()); myClosure.inc(); // 返回 1 myClosure.inc(); // 返回 2 myClosure.inc(); // 返回 3 // 相信对JS熟悉的朋友都能很快理解这段代码 // 那么在这段代码运行的背后究竟发生了怎样的事情呢?
現在,我終於知道了答案,我感到很興奮並且決定向大家解釋這個答案。至少,我一定是不會忘記這個答案的。
Tell me and I forget. Teach me and I remember. Involve me and I learn.
© Benjamin Franklin
並且,在我閱讀與閉包相關的現存的資料時,我很努力地嘗試著去在腦海中想想每個事物之間的聯繫:對象之間是如何引用的,對象之間的繼承關係是什麼,等等。我找不到關於這些負責關係的很好的圖表,於是我決定自己畫一些。
我將假設讀者對JavaScript已經比較熟悉了,知道什麼是全域對象,知道函數在JavaScript當中是“first-class objects”,等等。
當JavaScript在運作的時候,它需要一些空間讓它來儲存本機變數(local variables)。我們將這些空間稱為作用域物件(Scope object),有時也稱為LexicalEnvironment
。例如,當你呼叫函數時,函數定義了一些本地變量,這些變量就被儲存在一個作用域物件中。你可以將作用域函數想像成一個普通的JavaScript對象,但是有一個很大的差別就是你不能夠直接在JavaScript當中直接取得這個對象。你只可以修改這個物件的屬性,但是你不能夠取得這個物件的參考。
作用域物件的概念使得JavaScript和C、C++非常不同。在C、C++中,本地變數被保存在堆疊(stack)中。 在JavaScript中,作用域物件是在堆中被創建的(至少表現出來的行為是這樣的),所以在函數返回後它們也還是能夠被訪問到而不被銷毀。
如你做想的,作用域物件是可以有父作用域物件(parent scope object)的。當程式碼試圖存取一個變數的時候,解釋器將在目前的作用域物件中尋找這個屬性。如果這個屬性不存在,那麼解釋器就會在父作用域物件中尋找這個屬性。就這樣,一直向父作用域物件查找,直到找到該屬性或再也沒有父作用域物件。我們將這個查找變數的過程中所經過的作用域物件乘坐作用域鏈(Scope chain)。
在作用域鏈中找出變數的過程和原型繼承(prototypal inheritance)有著非常相似之處。但是,非常不一樣的地方在於,當你在原型鏈(prototype chain)中找不到一個屬性的時候,並不會引發一個錯誤,而是會得到undefined
。但是如果你試圖存取一個作用域鏈中不存在的屬性的話,你就會得到一個ReferenceError
。
在作用域鏈的最頂層的元素就是全域物件(Global Object)了。運行在全域環境的JavaScript程式碼中,作用域鏈總是只含有一個元素,那就是全域物件。所以,當你在全域環境中定義變數的時候,它們就會被定義到全域物件中。當函數被呼叫的時候,作用域鏈就會包含多個作用域物件。
好了,理論就說到這裡。接下來我們來從實際的程式碼入手。
// my_script.js "use strict"; var foo = 1; var bar = 2;
我們在全域環境中建立了兩個變數。正如我剛才所說,此時的作用域物件就是全域物件。
在上面的程式碼中,我們有一個執行的上下文(myscript.js自身的程式碼),以及它所引用的作用域對象。全域物件裡面還含有很多不同的屬性,在這裡我們就忽略了。
接下來,我們看這段程式碼
"use strict"; var foo = 1; var bar = 2; function myFunc() { //-- define local-to-function variables var a = 1; var b = 2; var foo = 3; console.log("inside myFunc"); } console.log("outside"); //-- and then, call it: myFunc();
當myFunc
被定義的時候,myFunc
的標識符(identifier)就被加到了目前的作用域物件中(在這裡是全域物件),而這個標識符所引用的是一個函數物件(function object)。函數物件中所包含的是函數的原始碼以及其他的屬性。其中一個我們所關心的屬性就是內部屬性[[scope]]
。 [[scope]]
所指向的就是目前的作用域物件。也就是指的就是函數的標識符被創建的時候,我們所能夠直接存取的那個作用域物件(這裡就是全域物件)。
“直接访问”的意思就是,在当前作用域链中,该作用域对象处于最底层,没有子作用域对象。
所以,在console.log("outside")
被运行之前,JavaScript 閉包的底層運行機製程式碼詳解是如下图所示。
温习一下。myFunc
所引用的函数对象其本身不仅仅含有函数的代码,并且还含有指向其被创建的时候的作用域对象。这一点非常重要!
当myFunc
函数被调用的时候,一个新的作用域对象被创建了。新的作用域对象中包含myFunc
函数所定义的本地变量,以及其参数(arguments)。这个新的作用域对象的父作用域对象就是在运行myFunc
时我们所能直接访问的那个作用域对象。
所以,当myFunc
被执行的时候,JavaScript 閉包的底層運行機製程式碼詳解如下图所示。
现在我们就拥有了一个作用域链。当我们试图在myFunc
当中访问某些变量的时候,JavaScript会先在其能直接访问的作用域对象(这里就是myFunc() scope
)当中查找这个属性。如果找不到,那么就在它的父作用域对象当中查找(在这里就是Global Object
)。如果一直往上找,找到没有父作用域对象为止还没有找到的话,那么就会抛出一个ReferenceError
。
例如,如果我们在myFunc
中要访问a
这个变量,那么在myFunc scope
当中就可以找到它,得到值为1
。
如果我们尝试访问foo
,我们就会在myFunc() scope
中得到3
。只有在myFunc() scope
里面找不到foo
的时候,JavaScript才会往Global Object
去查找。所以,这里我们不会访问到Global Object
里面的foo
。
如果我们尝试访问bar
,我们在myFunc() scope
当中找不到它,于是就会在Global Object
当中查找,因此查找到2。
很重要的是,只要这些作用域对象依然被引用,它们就不会被垃圾回收器(garbage collector)销毁,我们就一直能访问它们。当然,当引用一个作用域对象的最后一个引用被解除的时候,并不代表垃圾回收器会立刻回收它,只是它现在可以被回收了。
所以,当myFunc()
返回的时候,再也没有人引用myFunc() scope
了。当垃圾回收结束后,JavaScript 閉包的底層運行機製程式碼詳解变成回了调用前的关系。
接下来,为了图表直观起见,我将不再将函数对象画出来。但是,请永远记着,函数对象里面的[[scope]]
属性,保存着该函数被定义的时候所能够直接访问的作用域对象。
正如前面所说,当一个函数返回后,没有其他对象会保存对其的引用。所以,它就可能被垃圾回收器回收。但是如果我们在函数当中定义嵌套的函数并且返回,被调用函数的一方所存储呢?(如下面的代码)
function myFunc() { return innerFunc() { // ... } } var innerFunc = myFunc();
你已经知道的是,函数对象中总是有一个[[scope]]
属性,保存着该函数被定义的时候所能够直接访问的作用域对象。所以,当我们在定义嵌套的函数的时候,这个嵌套的函数的[[scope]]
就会引用外围函数(Outer function)的当前作用域对象。
如果我们将这个嵌套函数返回,并被另外一个地方的标识符所引用的话,那么这个嵌套函数及其[[scope]]
所引用的作用域对象就不会被垃圾回收所销毁。
"use strict"; function createCounter(initial) { var counter = initial; function increment(value) { counter += value; } function get() { return counter; } return { increment: increment, get: get }; } var myCounter = createCounter(100); console.log(myCounter.get()); // 返回 100 myCounter.increment(5); console.log(myCounter.get()); // 返回 105
当我们调用createCounter(100)
的那一瞬间,JavaScript 閉包的底層運行機製程式碼詳解如下图
注意increment
和get
函数都存有指向createCounter(100) scope
的引用。如果createCounter(100)
没有任何返回值,那么createCounter(100) scope
不再被引用,于是就可以被垃圾回收。但是因为createCounter(100)
实际上是有返回值的,并且返回值被存储在了myCounter
中,所以对象之间的引用关系变成了如下图所示
所以,createCounter(100)
虽然已经返回了,但是它的作用域对象依然存在,可以且仅只能被嵌套的函数(increment
和get
)所访问。
让我们试着运行myCounter.get()
。刚才说过,函数被调用的时候会创建一个新的作用域对象,并且该作用域对象的父作用域对象会是当前可以直接访问的作用域对象。所以,当myCounter.get()
被调用时的一瞬间,JavaScript 閉包的底層運行機製程式碼詳解如下。
在myCounter.get()
运行的过程中,作用域链最底层的对象就是get() scope
,这是一个空对象。所以,当myCounter.get()
访问counter
变量时,JavaScript在get() scope
中找不到这个属性,于是就向上到createCounter(100) scope
当中查找。然后,myCounter.get()
将这个值返回。
调用myCounter.increment(5)
的时候,事情变得更有趣了,因为这个时候函数调用的时候传入了参数。
正如你所见,increment(5)
的调用创建了一个新的作用域对象,并且其中含有传入的参数value
。当这个函数尝试访问value
的时候,JavaScript立刻就能在当前的作用域对象找到它。然而,这个函数试图访问counter
的时候,JavaScript无法在当前的作用域对象找到它,于是就会在其父作用域createCounter(100) scope
中查找。
我们可以注意到,在createCounter
函数之外,除了被返回的get
和increment
两个方法,没有其他的地方可以访问到value
这个变量了。这就是用闭包实现“私有变量”的方法。
我们注意到initial
变量也被存储在createCounter()
所创建的作用域对象中,尽管它没有被用到。所以,我们实际上可以去掉var counter = initial;
,将initial
改名为counter
。但是为了代码的可读性起见,我们保留原有的代码不做变化。
需要注意的是作用域链是不会被复制的。每次函数调用只会往作用域链下面新增一个作用域对象。所以,如果在函数调用的过程当中对作用域链中的任何一个作用域对象的变量进行修改的话,那么同时作用域链中也拥有该作用域对象的函数对象也是能够访问到这个变化后的变量的。
这也就是为什么下面这个大家都很熟悉的例子会不能产出我们想要的结果。
"use strict"; var elems = document.getElementsByClassName("myClass"), i; for (i = 0; i < elems.length; i++) { elems[i].addEventListener("click", function () { this.innerHTML = i; }); }
在上面的循环中创建了多个函数对象,所有的函数对象的[[scope]]
都保存着对当前作用域对象的引用。而变量i
正好就在当前作用域链中,所以循环每次对i
的修改,对于每个函数对象都是能够看到的。
现在我们来看一个更有趣的例子。
"use strict"; function createCounter(initial) { // ... } var myCounter1 = createCounter(100); var myCounter2 = createCounter(200);
当myCounter1
和myCounter2
被创建后,JavaScript 閉包的底層運行機製程式碼詳解为
在上面的例子中,myCounter1.increment
和myCounter2.increment
的函数对象拥有着一样的代码以及一样的属性值(name
,length
等等),但是它们的[[scope]]
指向的是不一样的作用域对象。
这才有了下面的结果
var a, b; a = myCounter1.get(); // a 等于 100 b = myCounter2.get(); // b 等于 200 myCounter1.increment(1); myCounter1.increment(2); myCounter2.increment(5); a = myCounter1.get(); // a 等于 103 b = myCounter2.get(); // b 等于 205
this
this
的值不会被保存在作用域链中,this
的值取决于函数被调用的时候的情景。
译者注:对这部分,译者自己曾经写过一篇更加详尽的文章,请参考《用自然语言的角度理解JavaScript中的this关键字》。原文的这一部分以及“
this
在嵌套的函数中的使用”译者便不再翻译。
让我们来回想我们在本文开头提到的一些问题。
什么是闭包?闭包就是同时含有对函数对象以及作用域对象引用的最想。实际上,所有JavaScript对象都是闭包。
闭包是什么时候被创建的?因为所有JavaScript对象都是闭包,因此,当你定义一个函数的时候,你就定义了一个闭包。
闭包是什么时候被销毁的?当它不被任何其他的对象引用的时候。
本文采用下面的专有名词翻译表,如有更好的翻译请告知,尤其是加*
的翻译
*全局环境中运行的代码:top-level code
参数:arguments
作用域对象:Scope object
作用域链:Scope Chain
栈:stack
原型继承:prototypal inheritance
原型链:prototype chain
全局对象:Global Object
标识符:identifier
垃圾回收器:garbage collector
以上就是JavaScript, 闭包,运行机制的内容,更多相关内容请关注PHP中文网(www.php.cn)!