無限分類左右值實作演算法

WBOY
發布: 2016-07-29 09:14:40
原創
1141 人瀏覽過

一、引言

產品分類,多層次的樹狀結構的論壇,郵件列表等許多地方我們都會遇到這樣的問題:如何儲存多層次結構的資料?在PHP的應用中,提供後台資料儲存的通常是關係型資料庫,它能夠保存大量的數據,提供高效率的資料檢索和更新服務。然而關係型資料的基本形式是縱橫交錯的表,是一個平面的結構,如果要將多層次樹狀結構儲存在關係型資料庫中就需要進行合理的翻譯工作。接下來我會將自己的所見所聞和一些實用的經驗和大家探討一下:
層級結構的資料保存在平面的資料庫中基本上有兩種常用設計方法:
* 毗鄰目錄模式(adjacency list model)
* 預先排序遍歷樹演算法(modified preorder tree traversal algorithm)

二、模型

這裡我用一個簡單食品目錄作為我們的範例資料。
我們的資料結構是這樣的,以下是程式碼:

<code>Food
<span>|</span><span>|---Fruit</span><span>|    |</span><span>|    |---Red</span><span>|    |    |</span><span>|    |    |--Cherry</span><span>|    |</span><span>|    +---Yellow</span><span>|          |</span><span>|          +--Banana</span><span>|</span>
+---Meat
      <span>|--Beef</span>
      +--Pork</code>
登入後複製

為了照顧那些英文一塌糊塗的PHP愛好者

<code>Food  : 食物
Fruit : 水果
Red   : 红色
<span>Cherry:</span> 樱桃
<span>Yellow:</span> 黄色
<span>Banana:</span> 香蕉
Meat  : 肉类
Beef  : 牛肉
Pork  : 猪肉</code>
登入後複製

三、實現

1、毗鄰目錄模式(adjacency list model)

我們經常用這種模式到,很多的教學和書中也介紹過。我們透過為每個節點增加一個屬性 parent 來表示這個節點的父節點從而將整個樹狀結構透過平面的表格描述出來。根據這個原則,例子中的資料可以轉換成如下的表:
以下是程式碼:

<code><span>+-----------------------+</span><span>|   parent |    name    |
+-----------------------+</span>
|          |    Food    |
|   Food   |   Fruit    |
|   Fruit  |    Green   |
|   Green  |    Pear    |
|   Fruit  |    Red     |
|   Red    |    Cherry  |
|   Fruit  |    Yellow  |
|   Yellow |    Banana  |
|   Food   |    Meat    |
|   Meat   |    Beef    |
<span>|   Meat   |    Pork    |
+-----------------------+</span></code>
登入後複製

我們看到 Pear 是Green的子節點,Green是Fruit的子節點。而根節點’Food’沒有父節點。 為了簡單地描述這個問題,這個範例中只用了name來表示一個記錄。 在實際的資料庫中,你需要用數字的id來標示每個節點,資料庫的表格結構大概應該像這樣:id, parent_id, name, descrīption。
有了這樣的表我們就可以透過資料庫保存整個多層次樹狀結構了。

顯示多層次樹,如果我們需要顯示這樣的一個多層次結構需要一個遞歸函數
以下是程式碼:

<code><span><span><?php</span><span>// $parent is the parent of the children we want to see</span><span>// $level is increased when we go deeper into the tree,</span><span>//        used to display a nice indented tree</span><span><span>function</span><span>display_children</span><span>(<span>$parent</span>, <span>$level</span>)</span> {</span><span>// 获得一个 父节点 $parent 的所有子节点</span><span>$result</span> = mysql_query(<span>"
        SELECT name
        FROM tree
        WHERE parent = '"</span> . <span>$parent</span> . <span>"'
        ;"</span>
    );
    <span>// 显示每个子节点</span><span>while</span> (<span>$row</span> = mysql_fetch_array(<span>$result</span>)) {
        <span>// 缩进显示节点名称</span><span>echo</span> str_repeat(<span>'  '</span>, <span>$level</span>) . <span>$row</span>[<span>'name'</span>] . <span>"\n"</span>;
        <span>//再次调用这个函数显示子节点的子节点</span>
        display_children(<span>$row</span>[<span>'name'</span>], <span>$level</span>+<span>1</span>);
    }
}
<span>?></span></span></code>
登入後複製

對整個結構的根節點(Food)使用這個函數就可以列印出整個多級樹結構,由於Food是根節點它的父節點是空的,所以這樣調用: display_children(”, 0)。我們可以知道從根節點到任意節點的路徑。例如Cherry 的路徑是「Food >; Fruit >; Red」。節點”Red”把它加到路徑中,然後我們再查詢Red的父節點並把它也添加到路徑中,以此類推直到最高層的”Food”,以下是代碼:

<code>Food
    Fruit
        <span>Red</span>
            Cherry
        <span>Yellow</span>
            Banana
    Meat
        Beef
        Pork</code>
登入後複製

如果對”Cherry 「使用這個函數:print_r(get_path('Cherry')),就會得到這樣的一個陣列了:

<code><span><span><?php</span><span>// $node 是那个最深的节点</span><span><span>function</span><span>get_path</span><span>(<span>$node</span>)</span> {</span><span>// 查询这个节点的父节点</span><span>$result</span> = mysql_query(<span>"
        SELECT parent
        FROM tree
        WHERE name = '"</span> . <span>$node</span> .<span>"'
        ;"</span>
    );
    <span>$row</span> = mysql_fetch_array(<span>$result</span>);
    <span>// 用一个数组保存路径</span><span>$path</span> = <span>array</span>();
    <span>// 如果不是根节点则继续向上查询</span><span>// (根节点没有父节点)</span><span>if</span> (<span>$row</span>[<span>'parent'</span>] != <span>''</span>) {
        <span>// the last part of the path to $node, is the name</span><span>// of the parent of $node</span><span>$path</span>[] = <span>$row</span>[<span>'parent'</span>];
        <span>// we should add the path to the parent of this node</span><span>// to the path</span><span>$path</span> = array_merge(get_path(<span>$row</span>[<span>'parent'</span>]), <span>$path</span>);
    }
    <span>// return the path</span><span>return</span><span>$path</span>;
}
<span>?></span></span></code>
登入後複製

接下來如何把它印成你希望的格式,就是你的事情了。

缺點:

這種方法很簡單,容易理解,好上手。但是也有一些缺點。主要是因為運行速度很慢,由於得到每個節點都需要進行資料庫查詢,資料量大的時候要進行很多查詢才能完成一個樹。另外由於要進行遞歸運算,遞迴的每一級都需要佔用一些記憶體所以在空間利用上效率也比較低。

2、預先排序遍歷樹演算法


現在讓我們來看看另外一種不使用遞歸計算,更快速的方法,這就是預排序遍歷樹演算法(modified preorder tree traversal algorithm)

這種方法大家可能接觸的比較少,初次使用也不像上面的方法容易理解,但是由於這種方法不使用遞迴查詢演算法,所以有更高的查詢效率。

我們首先將多級數據按照下面的方式畫在紙上,在根節點Food的左側寫上1 然後沿著這個樹繼續向下在Fruit 的左側寫上2 然後繼續前進,沿著整個樹的邊緣給每一個節點都標上左側和右側的數字。最後一個數字是標示在Food 右側的 18。在下面的這張圖中你可以看到整個標好了數字的多層結構。 (沒看懂?用你的手指指著數字從1數到18就明白怎麼回事了。還不明白,再數一遍,注意移動你的手指)。

這些數字標明了各個節點之間的關係,”Red”的號碼是3和6,它是 “Food” 1-18 的子孫節點。 同樣,我們可以看到 所有左值大於2和右值小於11的節點 都是”Fruit” 2-11 的子孫節點。
以下是程式碼:

<code><span>Array</span> (
    [<span>0</span>] => Food
    [<span>1</span>] => Fruit
    [<span>2</span>] => Red
)</code>
登入後複製

這樣整個樹狀結構可以透過左右值來儲存到資料庫中。繼續之前,我們先來看看下面整理過的資料表。
以下是代碼:

<code><span>+----------+</span>------------<span>+-----+</span>-----+
<span>|  parent  |    name    | lft | rgt |
+----------+------------+-----+-----+</span>
|          |    Food    | 1   | 18  |
|   Food   |   Fruit    | 2   | 11  |
|   Fruit  |    Red     | 3   |  6  |
|   Red    |    Cherry  | 4   |  5  |
|   Fruit  |    Yellow  | 7   | 10  |
|   Yellow |    Banana  | 8   |  9  |
|   Food   |    Meat    | 12  | 17  |
|   Meat   |    Beef    | 13  | 14  |
<span>|   Meat   |    Pork    | 15  | 16  |
+----------+------------+-----+-----+</span></code>
登入後複製

注意:由于”left”和”right”在 SQL中有特殊的意义,所以我们需要用”lft”和”rgt”来表示左右字段。 另外这种结构中不再需要”parent”字段来表示树状结构。也就是 说下面这样的表结构就足够了。
以下是代码:

<code><span>+------------+</span>-----<span>+-----+</span><span>|    name    | lft | rgt |
+------------+-----+-----+</span>
|    Food    | 1   | 18  |
|    Fruit   | 2   | 11  |
|    Red     | 3   |  6  |
|    Cherry  | 4   |  5  |
|    Yellow  | 7   | 10  |
|    Banana  | 8   |  9  |
|    Meat    | 12  | 17  |
|    Beef    | 13  | 14  |
<span>|    Pork    | 15  | 16  |
+------------+-----+-----+</span></code>
登入後複製

好了我们现在可以从数据库中获取数据了,例如我们需要得到”Fruit”项下的所有所有节点就可以这样写查询语句:

<code><span><span>SELECT</span> * <span>FROM</span> tree <span>WHERE</span> lft BETWEEN <span>2</span><span>AND</span><span>11</span>;</span></code>
登入後複製

这个查询得到了以下的结果。
以下是代码:

<code><span>+------------+</span>-----<span>+-----+</span><span>|    name    | lft | rgt |
+------------+-----+-----+</span>
|    Fruit   | 2   | 11  |
|    Red     | 3   |  6  |
|    Cherry  | 4   |  5  |
|    Yellow  | 7   | 10  |
<span>|    Banana  | 8   |  9  |
+------------+-----+-----+</span></code>
登入後複製

看到了吧,只要一个查询就可以得到所有这些节点。为了能够像上面的递归函数那样显示整个树状结构,我们还需要对这样的查询进行排序。用节点的左值进行排序:

<code><span><span>SELECT</span> * <span>FROM</span> tree <span>WHERE</span> lft BETWEEN <span>2</span><span>AND</span><span>11</span><span>ORDER</span><span>BY</span> lft <span>ASC</span>;</span></code>
登入後複製

剩下的问题如何显示层级的缩进了。
以下是代码:

<code><span><span><?php</span><span><span>function</span><span>display_tree</span><span>(<span>$root</span>)</span> {</span><span>// 得到根节点的左右值</span><span>$result</span> = mysql_query(<span>"
        SELECT lft, rgt
        FROM tree
        WHERE name = '"</span> . <span>$root</span> . <span>"'
        ;"</span>
    );
    <span>$row</span> = mysql_fetch_array(<span>$result</span>);
    <span>// 准备一个空的右值堆栈</span><span>$right</span> = <span>array</span>();
    <span>// 获得根基点的所有子孙节点</span><span>$result</span> = mysql_query(<span>"
        SELECT name, lft, rgt
        FROM tree
        WHERE lft BETWEEN '"</span> . <span>$row</span>[<span>'lft'</span>] . <span>"' AND '"</span> . <span>$row</span>[<span>'rgt'</span>] .<span>"'
        ORDER BY lft ASC
        ;"</span>
    );
    <span>// 显示每一行</span><span>while</span> (<span>$row</span> = mysql_fetch_array(<span>$result</span>)) {
        <span>// only check stack if there is one</span><span>if</span> (count(<span>$right</span>) > <span>0</span>) {
            <span>// 检查我们是否应该将节点移出堆栈</span><span>while</span> (<span>$right</span>[count(<span>$right</span>) - <span>1</span>] < <span>$row</span>[<span>'rgt'</span>]) {
                array_pop(<span>$right</span>);
            }
        }
        <span>// 缩进显示节点的名称</span><span>echo</span> str_repeat(<span>'  '</span>,count(<span>$right</span>)) . <span>$row</span>[<span>'name'</span>] . <span>"\n"</span>;
        <span>// 将这个节点加入到堆栈中</span><span>$right</span>[] = <span>$row</span>[<span>'rgt'</span>];
    }
}
<span>?></span></span></code>
登入後複製

如果你运行一下以上的函数就会得到和递归函数一样的结果。只是我们的这个新的函数可能会更快一些,因为只有2次数据库查询。
要获知一个节点的路径就更简单了,如果我们想知道Cherry 的路径就利用它的左右值4和5来做一个查询。

<code><span>SELECT</span> name <span>FROM</span> tree <span>WHERE</span> lft < <span>4</span><span>AND</span> rgt >; <span>5</span><span>ORDER</span><span>BY</span> lft <span>ASC</span>;</code>
登入後複製

这样就会得到以下的结果:
以下是代码:

<code><span>+------------+</span><span>|    name    |
+------------+</span>
|    Food    |
|    Fruit   |
<span>|    Red     |
+------------+</span></code>
登入後複製

那么某个节点到底有多少子孙节点呢?很简单,子孙总数=(右值-左值-1)/2

<code>descendants = (<span>right</span> – <span>left</span> - <span>1</span>) / <span>2</span></code>
登入後複製

不相信?自己算一算啦。
用这个简单的公式,我们可以很快的算出”Fruit 2-11”节点有4个子孙节点,而”Banana 8-9”节点没有子孙节点,也就是说它不是一个父节点了。
很神奇吧?虽然我已经多次用过这个方法,但是每次这样做的时候还是感到很神奇。
这的确是个很好的办法,但是有什么办法能够帮我们建立这样有左右值的数据表呢?这里再介绍一个函数给大家,这个函数可以将name和parent结构的表自动转换成带有左右值的数据表。
以下是代码:

<code><span><?php</span><span><span>function</span><span>rebuild_tree</span><span>(<span>$parent</span>, <span>$left</span>)</span> {</span><span>// the right value of this node is the left value + 1</span><span>$right</span> = <span>$left</span>+<span>1</span>;
    <span>// get all children of this node</span><span>$result</span> = mysql_query(<span>"
        SELECT name
        FROM tree
        WHERE parent = '"</span> . <span>$parent</span> . <span>"'
        ;"</span>
    );
    <span>while</span> (<span>$row</span> = mysql_fetch_array(<span>$result</span>)) {
        <span>// recursive execution of this function for each</span><span>// child of this node</span><span>// $right is the current right value, which is</span><span>// incremented by the rebuild_tree function</span><span>$right</span> = rebuild_tree(<span>$row</span>[<span>'name'</span>], <span>$right</span>);
    }
    <span>// we've got the left value, and now that we've processed</span><span>// the children of this node we also know the right value</span>
    mysql_query(<span>"
        UPDATE tree
        SET
            lft = '"</span> . <span>$left</span> . <span>"',
            rgt= '"</span> . <span>$right</span> . <span>"'
        WHERE name = '"</span> . <span>$parent</span> . <span>"'
        ;"</span>
    );
    <span>// return the right value of this node + 1</span><span>return</span><span>$right</span> + <span>1</span>;
}
<span>?></span></code>
登入後複製

当然这个函数是一个递归函数,我们需要从根节点开始运行这个函数来重建一个带有左右值的树

<code><span>rebuild_tree(<span>'Food'</span>,<span>1</span>)</span>;</code>
登入後複製

这个函数看上去有些复杂,但是它的作用和手工对表进行编号一样,就是将立体多层结构的转换成一个带有左右值的数据表。

那么对于这样的结构我们该如何增加,更新和删除一个节点呢?
增加一个节点一般有两种方法:
第一种,保留原有的name 和parent结构,用老方法向数据中添加数据,每增加一条数据以后使用rebuild_tree函数对整个结构重新进行一次编号。
第二种,效率更高的办法是改变所有位于新节点右侧的数值。举例来说:我们想增加一种新的水果”Strawberry”(草莓)它将成为”Red”节点的最后一个子节点。首先我们需要为它腾出一些空间。”Red”的右值应当从6改成8,”Yellow 7-10 “的左右值则应当改成 9-12。依次类推我们可以得知,如果要给新的值腾出空间需要给所有左右值大于5的节点 (5 是”Red”最后一个子节点的右值) 加上2。所以我们这样进行数据库操作:

<code><span><span>UPDATE</span> tree <span>SET</span> rgt = rgt + <span>2</span><span>WHERE</span> rgt > <span>5</span>;</span><span><span>UPDATE</span> tree <span>SET</span> lft = lft + <span>2</span><span>WHERE</span> lft > <span>5</span>;</span></code>
登入後複製

这样就为新插入的值腾出了空间,现在可以在腾出的空间里建立一个新的数据节点了, 它的左右值分别是6和7

<code><span><span>INSERT</span><span>INTO</span> tree <span>SET</span> lft=<span>6</span>, rgt=<span>7</span>, name=<span>'Strawberry'</span>;</span></code>
登入後複製

再做一次查询看看吧!怎么样?很快吧。

四、结语

好了,现在你可以用两种不同的方法设计你的多级数据库结构了,采用何种方式完全取决于你个人的判断,但是对于层次多数量大的结构我更喜欢第二种方法。如果查询量较小但是需要频繁添加和更新的数据,则第一种方法更为简便。
另外,如果数据库支持的话 你还可以将rebuild_tree()和 腾出空间的操作写成数据库端的触发器函数, 在插入和更新的时候自动执行, 这样可以得到更好的运行效率, 而且你添加新节点的SQL语句会变得更加简单。

http://www.cnblogs.com/guowei1027/archive/2009/12/14/1623507.html

以上就介绍了无限分类左右值实现算法,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

相關標籤:
來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板