之前聽說火狐的JS引擎支援for each in的語法,例如下述的代碼:
由於只有FireFox才支持,所以幾乎所有的JS程式碼都不用這個特徵。
不過在ActionScript裡天生就支援for each的語法,不論Array還是Vector,還是Dictionary,只要是可枚舉的物件都可以for in和for each in。
之前並沒有感覺有太大的差異,為了懶得敲一個each單詞,一直用熟悉的for in來遍歷。
不過今天仔細琢磨了會,從資料結構的角度分析了下,覺得for in和for each in效率上有著本質的區別,無論是JS還是AS。
原因很簡單:Array不是真正意義上的陣列!
何為真正意義的陣列?當然就是傳統語言裡type[]定義的資料類型,所有元素都是連續保存的。
「Array」雖然也是陣列的意思,但熟悉JS的都知道,它其實是個非線性的偽數組,下標可以是任意數字。寫入arr[1000000]並非真正申請容納一百萬個元素的空間,而是把1000000轉換成相應的哈希值,對應到很小一塊儲存空間裡,從而節省了大量內存。
例如有下列陣列:
遍歷時每次存取arr[k],都要進行一次Hash(k)計算,根據散列表的容量取模,最終在衝突鍊錶裡找到結果。
如果支援for each...in的語法,其內部的資料結構就決定了會快很多:
Array裡儲存存了keys的列表,也把每個values值當作鍊錶關聯起來。每當有值新增或刪除,就更新其連結關係。
當for each...in遍歷時,只需從第一個節點往後迭代即可,無需任何Hash計算。
當然,對於AS3裡Vector這樣的線性陣列來說,兩者相差不大;同理,HTML5裡支援二進位的陣列ArrayBuffer也是如此。不過從理論上來看,即使arr是個連續的線性數組,for each in還是要快一點:
for...in遍歷時,每次訪問arr[k]都要進行下標越界檢查;而for each in則根據內部鍊錶,直接從底層反饋出迭代變量,節省了越界檢查的過程。