常常有人問我, PHP的陣列, 如果用foreach來存取, 遍歷的順序是固定的麼? 以什麼順序遍歷呢?
例如:
. 代碼如下:
? ['laruence'] = 'huixinchen';
$arr['yahoo'] = 2007;
$arr['baidu'] = 2008;
foreach ($arr as $key => $val) {
/結果是什麼?
}
. 代碼如下:
foreach ($arr as $key => $val) {
//現在結果又是什麼?
}
要完全了解這個問題, 我想首先了解PHP數組應該要完全了解PHP的數字內部實作結構……
PHP的陣列
在PHP中, 陣列是用一種HASH結構(HashTable)來實現的, PHP使用了一些機制, 使得可以在O(1)的時間複雜度下實現數組的增刪, 並同時支援線性遍歷和隨機訪問.
之前的文章中也討論過, PHP的HASH算法, 基於此, 我們做進一步的延伸.
認識HashTable之前, 首先讓我們看看HashTable的結構定義, 我加了註解方便大家理解:
. 程式碼如下:
typedef struct _hashtable {
uint nTableSize; /* 散大小, Hash值的列表間隔*/ , 用於快速定位*/
uint nNumOfElements; /* HashTable中實際元素的個數*/
ulong nNextFreeElement; /* 下個空閒可用位置的數字索引*/
Bucket *pInternalPointer; /* 內部指標被reset, current這些遍歷函數使用*/
Bucket *pListHead; /* 頭元素, 用於線性遍歷函數使用*/
Bucket *pListHead; /* 頭元素, 用於線性遍歷函數使用*/
Bucket *pListHead; /* 頭元素, 用於線性遍歷函數使用*/
Bucket *pListHead; /* 頭元素, 用於線性遍歷*/
Bucket *pListTail; /* 尾元素, 用於線性遍歷*/
Bucket **arBuckets /*實際的儲存容器*/
dtor_func_t pDestructor;/* 元素的析構函數(指標) */
zend_bool persistent;
unsigned char nApplyCount; /* 循環遍歷保護*/ istent;
#endif
} HashTable;
關於nApplyCount的意義, 我們可以透過一個例子來了解:
. ,5,);
$arr[] = &$arr;
var_export($arr); //Fatal error: Nesting level too deep - recursive dependency
循環而設立的.
查看上面的結構, 可以看出, 對於HashTable, 關鍵元素就是arBuckets了, 這個是實際存儲的容器, 讓我們來看看它的結構定義:
typedef struct bucket {
ulong h; /* 數字索引/hash值*/
uint nKeyLength; /* 字元索引的長度*/
void *pData; /* 資料*/ void *pData; / */
struct bucket *pListNext; /* 下一個元素, 用於線性遍歷*/
struct bucket *pListLast; /* 上一個元素, 用於線性遍歷*/
struct bucket *pNext; /* 處於同一個拉鍊中的下一個元素*/
struct bucket *pLast; /* 處於同一拉鍊中的上一個元素*/
char arKey[1]; /* 節省內存,方便初始化的技巧*/
} Bucket;
我們注意到, 最後一個元素, 這個是flexible array技巧, 可以節省內存,和方便初始化的一種做法, 有興趣的朋友可以google flexible array.
h是元素的Hash值,對於數字索引的元素,h為直接索引值(透過nKeyLength=0來表示是數字索引).而對於字串索引來說, 索引值保存在arKey中, 索引的長度保存在nKeyLength中.
在Bucket中,實際的數據是保存在pData指標所指向的記憶體區塊中,通常這個記憶體區塊是系統另外分配的。但有一種情況例外,就是當Bucket保存的資料是一個指針時,HashTable將不會另外請求系統分配空間來保存這個指針,而是直接將該指針保存到pDataPtr中,然後再將pData指向本結構成員的地址。這樣可以提高效率,減少記憶體碎片。由此我們可以看到PHP HashTable設計的精妙之處。如果Bucket中的資料不是指針,pDataPtr為NULL(本段來自Altair的”Zend HashTable詳解”)
HashTable的pListhHead指向線性列表形式下的第一個元素, 上圖中是元素1, pListTail指向的是最後一個元素0, 而對於每一個元素pListNext就是紅色線條畫出的線性結構的下一個元素, 而pListLast是上一個元素.
pInternalPointer指向當前的內部指針的位置, 在對數組進行順序遍歷的時候, 這個指針指明了當前的元素.
當在線性(順序)遍歷的時候, 就會從pListHead開始, 順著Bucket中的pListNext/pListLast, 根據移動pInternalPointer, 來實現對所有元素的線性遍歷.
例如, 對於foreach, 如果我們查看它產生的opcode序列, 我們可以發現, 在foreach之前, 會首先有個FE_RESET來重置數組的內部指針, 也就是pInternalPointer(關於foreach可以參看深入理解PHP原理之foreach ), 然後透過每次FE_FETCH來遞增pInternalPointer,從而實現順序遍歷.
類似的, 當我們使用, each/next系列函數來遍歷的時候, 也是透過移動數組的內部指針而實現了順序遍, 這裡有一個問題, 例如:
. 代碼如下:
$arr = array(1,2,3,4,5);
foreach ($arras $v) {
//可以取得
}
while (list($key, $v) = each($arr)) {
//取得不到
}
?>
,
很明朗了, 因為foreach會自動reset, 而while這塊不會reset, 所以在foreach結束以後, pInternalPointer指向數組最末端, while語句塊當然訪問不到了, 解決的辦法就是在each之前, 先reset數組的內部指針.
而在隨機訪問的時候, 就會透過hash值確定在hash數組中的頭指針位置, 然後通過pNext/pLast來找到特點元素.
增加元素的時候, 元素會插在相同Hash元素鏈的頭部和線性列表的尾部. 也就是說, 元素在線性遍歷的時候是根據插入的先後順序來遍歷的, 這個特殊的設計使得在PHP中,當使用數字索引時, 元素的先後順序是由添加的順序決定的,而不是索引順序.
也就是說, PHP中遍歷數組的順序, 是和元素的添加先後相關的, 那麼, 現在我們就很清楚的知道, 文章開頭的問題的輸出是:
huixinchen
2007
2008
. 程式碼如下:
以上就是深入理解PHP之數組(遍歷順序),更多相關文章請關注PHP中文網(www.php.cn)!