終於理解 MySQL 索引要用 B+tree ，而且還這麼快-mysql教程-PHP中文網

前言

B-tree

操作流程

插入

刪除

首頁

資料庫

mysql教程

終於理解 MySQL 索引要用 B+tree ，而且還這麼快

coldplay.xixi

Nov 18, 2020 pm 05:36 PM

mysql 索引

mysql教學欄位介紹理解索引的B tree。

免費推薦：mysql教學(影片)

前言

當你現在遇到了一條慢SQL 需要進行最佳化時，你第一時間能想到的最佳化手段是什麼？大部分人第一反應可能都是添加索引，在大多數情況下面，索引能夠將一條SQL 語句的查詢效率提高幾個數量級。索引的本質：用於快速尋找記錄的一種資料結構。索引的常用資料結構：

二元樹
紅黑樹
B-tree（B樹，不叫什麼B減樹）
B tree

資料結構圖形化網址：https://www.cs.usfca.edu/~galles/visualization/Algorithms.html索引查詢

大家知道select * from t where col = 88 這麼一條SQL 語句如果不走索引進行查找的話，正常地查就是全表掃描：從表的第一行記錄開始逐行找，把每一行的col 字段的值和88 進行對比，這明顯效率是很低的。

而如果走索引的話，查詢的流程就完全不一樣了（假設現在用一棵平衡二元樹資料結構儲存我們的索引列）此時該二元樹的儲存結構（Key - Value）：Key 是索引欄位的數據，Value 是索引所在行的磁碟檔案位址。當最後找到了88 的時候，就可以把它的Value 對應的磁碟檔案位址拿出來，然後就直接去磁碟上去找這一行的數據，這時候的速度就會比全表掃描快很多。

但實際上 MySQL 底層並沒有用二元樹來儲存索引數據，是用的B tree（B 樹）。為什麼不採用二元樹

假設此時用普通二元樹記錄 id 索引列，我們在每插入一行記錄的同時還要維護二元樹索引字段。

此時當我要找id = 7 的那條資料時，它的尋找過程如下：

#此時找id = 7 這行記錄時找了7 次，和我們全表掃描也沒什麼很大差別。顯而易見，二元樹對於這種依序遞增的資料列其實是不適合作為索引的資料結構。 為什麼不採用Hash 表

Hash 表：快速搜尋的資料結構，搜尋的時間複雜度O(1)Hash 函數：將一個任意型別的key，可以轉換成一個int 類型的下標

假設此時用Hash 表記錄id 索引列，我們在每插入一行記錄的同時還要維護Hash 表索引欄位。

這時候開始找 id = 7 的樹節點只找了 1 次，效率非常高了。

但 MySQL 的索引仍然不採用能夠精確定位的Hash 表。因為它不適用於範圍查詢。為什麼不採用紅黑樹

紅黑樹是一種特化的AVL樹（平衡二元樹），都是在進行插入和刪除操作時透過特定操作保持二元查找樹的平衡；若一棵二元查找樹是紅黑樹，則它的任一子樹必為紅黑樹。

假設此時用紅黑樹記錄 id 索引列，我們在每插入一行記錄的同時也要維護紅黑樹索引欄位。

插入過程中會發現它與普通二元樹不同的是當一棵樹的左右子樹高度差> 1 時，它會進行自旋操作，保持樹的平衡。這時候開始找 id = 7 的樹節點只找了 3 次，比所謂的普通二元樹還是要更快的。

但MySQL 的索引仍然不採用能夠精確定位和範圍查詢都優秀的紅黑樹。因為當MySQL 資料量很大的時候，索引的體積也會很大，可能內存放不下，所以需要從磁碟上進行相關讀寫，如果樹的層級太高，則讀寫磁碟的次數（I/O互動）就會越多，效能就會越差。

B-tree

紅黑樹目前的唯一不足點就是樹的高度不可控，所以現在我們的切入點就是樹的高度。目前一個節點是只分配了一個儲存1 個元素，如果要控制高度，我們就可以把一個節點分配的空間更大一點，讓它橫向儲存多個元素 ，這時候高度就可控了。這麼個改造過程，就變成了 B-tree。

B-tree 是一顆絕對平衡的多路樹。它的結構中還有兩個概念

度（Degree）：一個節點擁有的子節點（子樹）的數量。（有的地方是以度來說明B-tree 的，這裡解釋一下）階（order）：一個節點的子節點的最大數。（通常用 m 表示）關鍵字：資料索引。

一棵 m 階 B-tree 是一棵平衡的 m 路搜尋樹。它可能是空樹，或滿足以下特點：

除根節點和葉子節點外，其它每個節點至少有 $\lceil \dfrac{m}{2}\rceil$
####################### #############################2#################### ######################m############################ ########################⌉############### 個子節點;###
$⌈ \frac{#m}{##2} ⌉ \lceil \dfrac{m}{2}\rceil$
$\frac{}{} #2$ 2
⌉

###########################################################################################################如果######\lceil \dfrac{m}{2}\rceil###########################⌈##### ####################################2############## ############################m##################### ##############################⌉############### - 1 ≤ j ≤ m - 1;############節點的關鍵字從左到右遞增排列，有k 個關鍵字的非葉子節點剛好有(k 1) 個子節點；#### ########所有的葉子結點都位於同一層。 ############名字取義（題外話，放鬆一下）#########以下摘自維基百科#########魯道夫·拜爾（ Rudolf Bayer）和艾華·M·麥克雷（Ed M. McCreight）於1972年在波音研究實驗室（Boeing Research Labs）工作時發明了###B-tree###，但他們沒有解釋B 代表什麼意義（如果有的話）。 ######道格拉斯·科默爾（Douglas Comer）解釋說：兩位作者從來都沒解釋過 ###B-tree### 的原始意義。我們可能覺得 balanced, broad 或 bushy 可能適合。其他人建議字母 B 代表 Boeing。源自於他的贊助，不過，看起來把 ###B-tree### 當作 Bayer 樹更合適些。 ######高德納（Donald Knuth）在1980年5月發表的題為"CS144C classroom lecture about disk storage and B-trees" 的論文中推測了###B-tree### 的名字取義，提出B 可能意味Boeing 或Bayer 的名字。 ######查找#########B-tree### 的查找其實和二元樹很相似：######二元樹是每個節點上有一個關鍵字和兩個分支，###B-tree### 上每個節點有k 個關鍵字和(k 1) 個分支。 ######二元樹的查找只考慮向左或向右走，而 ###B-tree### 中需要由多個分支決定。 #########B-tree### 的找出分兩步驟：###

先找節點，由於B-tree 通常是在磁碟上儲存的所以這步驟需要進行磁碟IO操作；
找出關鍵字，當找到某個節點後將該節點讀入記憶體中然後通過順序或折半查找來查找關鍵字。若沒有找到關鍵字，則需要判斷大小才能找到適當的分支繼續尋找。

操作流程

現在需要尋找元素：88

第一次：磁碟IO

第二次：磁碟IO

第三次：磁碟IO

然後這有一次記憶體比對，分別跟70 與88 比對，最後找到88。

從查找過程中發現，B-tree 比對次數和磁碟IO的次數其實和二元樹相差不了多少，這麼看來並沒有什麼優勢。

但是仔細一看會發現，比對是在記憶體中完成中，不涉及磁碟IO，耗時可以忽略不計。

另外B-tree 中一個節點中可以存放很多的關鍵字（個數由階決定），相同數量的關鍵字在B-tree 中產生的節點要遠遠少於二元樹中的節點，相差的節點數量就等同於磁碟IO的次數。這樣到達一定數量後，性能的差異就顯現出來了。

插入

當 B-tree 要進行插入關鍵字時，都是直接找到葉子節點進行操作。

根據要插入的關鍵字查找到待插入的葉子節點；
因為一個節點的子節點的最大個數（階）為m ，所以需要判斷目前節點關鍵字的個數是否小於(m - 1)。
- 是：直接插入
- #否：發生節點分割，以節點的中間的關鍵字將該節點分成左右兩部分，中間的關鍵字放到父節點中即可。

操作流程

例如我們現在需要在Max Degree（階）為3 的B-tree 插入元素：72

尋找待插入的葉子節點
#節點分裂：本來應該要和[70,88] 在同一個磁碟區塊上，但是當一個節點有3 個關鍵字的時候，它就有可能有4 個子節點，就超過了我們所定義限制的最大度數3，所以此時必須進行分裂：以中間關鍵字為界將節點一分為二，產生一個新節點，並把中間關鍵字移到父節點中。

Tip : 當中間關鍵字有兩個時，通常會將左關鍵字進行上移分裂。

刪除

刪除操作就會比尋找和插入要麻煩一些，因為要刪除的關鍵字可能在葉子節點上，也可能不在，而且刪除後還可能導致B-tree 的不平衡，又要進行合併、旋轉等操作去維持整棵樹的平衡。

隨便拿棵樹（5 階）舉例

以上是終於理解 MySQL 索引要用 B+tree ，而且還這麼快的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1665

CakePHP 教程

1424

Laravel 教程

1321

PHP教程

1269

C# 教程

1249

Related knowledge

laravel入門實例 Apr 18, 2025 pm 12:45 PM

Laravel 是一款 PHP 框架，用於輕鬆構建 Web 應用程序。它提供一系列強大的功能，包括：安裝：使用 Composer 全局安裝 Laravel CLI，並在項目目錄中創建應用程序。路由：在 routes/web.php 中定義 URL 和處理函數之間的關係。視圖：在 resources/views 中創建視圖以呈現應用程序的界面。數據庫集成：提供與 MySQL 等數據庫的開箱即用集成，並使用遷移來創建和修改表。模型和控制器：模型表示數據庫實體，控制器處理 HTTP 請求。

MySQL和PhpMyAdmin：核心功能和功能 Apr 22, 2025 am 12:12 AM

MySQL和phpMyAdmin是強大的數據庫管理工具。 1）MySQL用於創建數據庫和表、執行DML和SQL查詢。 2）phpMyAdmin提供直觀界面進行數據庫管理、表結構管理、數據操作和用戶權限管理。

MySQL與其他編程語言：一種比較 Apr 19, 2025 am 12:22 AM

MySQL与其他编程语言相比，主要用于存储和管理数据，而其他语言如Python、Java、C 则用于逻辑处理和应用开发。MySQL以其高性能、可扩展性和跨平台支持著称，适合数据管理需求，而其他语言在各自领域如数据分析、企业应用和系统编程中各有优势。

解決數據庫連接問題：使用minii/db庫的實際案例 Apr 18, 2025 am 07:09 AM

在開發一個小型應用時，我遇到了一個棘手的問題：需要快速集成一個輕量級的數據庫操作庫。嘗試了多個庫後，我發現它們要么功能過多，要么兼容性不佳。最終，我找到了minii/db，這是一個基於Yii2的簡化版本，完美地解決了我的問題。

laravel框架安裝方法 Apr 18, 2025 pm 12:54 PM

文章摘要：本文提供了詳細分步說明，指導讀者如何輕鬆安裝 Laravel 框架。 Laravel 是一個功能強大的 PHP 框架，它 упростил 和加快了 web 應用程序的開發過程。本教程涵蓋了從系統要求到配置數據庫和設置路由等各個方面的安裝過程。通過遵循這些步驟，讀者可以快速高效地為他們的 Laravel 項目打下堅實的基礎。