建立索引的原則 - 以innodb為例
一、寫在前面
隨著開發、測試任務進入尾聲,大家都在整理一些項目發布前的一些準備工作,其中一個重要的工作就是為之前寫的一些sql語句建立索引,這高並發、在高訪問量的環境下是非常有必要的,建立一個好的索引能夠大大提高sql語句的查詢效率,那麼問題來了,到底什麼是索引,怎樣才能建立一個好的索引呢?本文以mysql Innodb儲存引擎為例,結合實際的專案來看一下,如何建立一個好的而索引。
二、索引定義
MySQL官方對索引的定義為:索引(Index)是幫助MySQL有效率地取得資料的資料結構。提取句子主幹,就可以得到索引的本質:索引是資料結構。
我們知道,資料庫查詢是資料庫最主要的功能之一,例如下面的SQL語句:SELECT * FROM test_table WHERE id = 99 ;可以從表test_table中取得id為99的資料記錄。
我們都希望查詢資料的速度能盡可能的快,因此資料庫系統的設計者會從查詢演算法的角度來最佳化。最基本的查詢演算法當然是順序查找(linear search),遍歷test_table然後逐行匹配id的值是否是99,這種複雜度為O(n)的演算法在資料量很大時顯然是糟糕的,好在電腦科學的發展提供了許多更優秀的查找演算法,例如二分查找(binary search)、二元樹查找(binary tree search)等。如果稍微分析一下會發現,每種查找演算法都只能應用於特定的資料結構之上,例如二分查找要求被檢索資料有序,而二叉樹查找只能應用於二叉查找樹上,但是資料本身的組織結構不可能完全滿足各種資料結構(例如,理論上不可能同時將兩列都按順序進行組織),所以,在資料之外,資料庫系統還維護著滿足特定查找演算法的資料結構,這些資料結構以某種方式引用(指向)數據,這樣就可以在這些數據結構上實作高階查找演算法。這種資料結構,就是索引。
舉上面的例子主要是為了簡單說明地說明索引的作用,包括mysql Innodb在內的大部分資料庫系統及文件系統並沒有選擇二元樹結構作為索引,而是採用了B-Tree或其變種B+Tree作為索引結構,這個索引結構可以最大限度地減少查找過程中磁碟I/O的訪問次數,關於什麼是B-Tree或B+Tree以及選擇它們做資料庫索引結構的原因,大家可以自行去學習。以下我們先介紹下mysql Innodb引擎的兩種B+Tree索引。
三、Mysql Innodb B+Tree索引
一種是主鍵索引,主鍵索引即聚集索引(Cluster Index),它不僅有主鍵,而且有主鍵所屬的全部數據,所以在Innodb中,主鍵索引即數據;
一種是列值為Key,主鍵位置為Value即(列值, 主鍵位置) 的非主鍵索引(Secondary Index)
下面我們來看看建立一個好的索引需要遵循的原則,並結合特定的例子來做說明;
1. 最左前綴匹配原則,非常重要的原則,mysql會一直向右匹配直到遇到範圍查詢( >、 3 and d = 4 如果建立(a,b,c,d)順序的索引,d是用不到索引的,如果建立(a,b,d,c)的索引則都可以用到,a,b,d的順序可以任意調整。
2. =和in可以亂序,例如a = 1 and b = 2 and c = 3 建立(a,b,c)索引可以任意順序,mysql的查詢優化器會幫你優化成索引可以識別的形式。
3. 盡量選擇區分度高的列作為索引,區分度的公式是count(distinct col)/count(*),表示字段不重複的比例,比例越大我們掃描的記錄數越少,唯一鍵的區分度是1,而一些狀態、性別字段可能在大數據面前區分度就是0,那可能有人會問,這個比例有什麼經驗值嗎?使用場景不同,這個值也很難確定,一般需要join的字段我們都要求是0.1以上,即平均1條掃描10條記錄
4. 索引列不能參與計算,保持列“乾淨”,比如from_unixtime(create_time ) = '2015-08-14'就不能使用到索引,原因很簡單,b+樹中存的都是資料表中的欄位值,但進行檢索時,需要把所有元素都套用函數才能比較,顯然成本太大。所以語句應該要寫成create_time = unix_timestamp(‘2015-08-14’)。
5. 盡量的擴充索引,不要新建索引。例如表中已經有a的索引,現在要加(a,b)的索引,那就只需要修改原來的索引即可。
6. 在order by或group by子句中,如果想透過索引來進行排序,所建立索引列的順序必須與order by或group by子句的順序一致,並且所有列的排序方向(倒序或正序)都一樣;如果查詢關聯多張表,則只有order by子句引用的欄位全部來自第一張表時,才能利用索引來排序;order by或group by語句與查詢型語句的限制是一樣的:需要滿足索引的最左前綴原則;否則mysql就要執行排序操作,無法利用索引來排序;(有一種情況order by或group by子句可以不滿足最左前綴原則,就是其前導為常數的時候,如果where或join對這些欄位指定了常數,就可以彌補索引的不足)。
五、舉例
語句1:
語句2:
對於這兩條語句,如果單獨進行考慮的話,大家可能會建立兩個索引;
針對語句1建立(status,netting_batch_no,debtor_agent_member_id);
針對語句2建立(netting_batch_no,debtor_agent_member_id,transaction_currency);
如果綜合考慮來看的話,其實就是一個索引就夠了,即(netting_batch_m transaction_currency欄位放到索引中,因為這兩個欄位的區分度太差;
根據建立索引的原則2,語句1是可以走到這個索引的;
根據建立索引的原則1,語句2也是可以走到這個索引的;
索引不是越多越好,建立過多的索引會增加資料庫記憶體或磁碟的消耗,並且會影響到得插入、刪除等操作的效能,索引在建立索引時要遵循索引建立的原則,通盤考慮;
以上就是建立索引的原則- 以innodb為例的內容,更多相關內容請關注PHP中文網(www.php.cn)!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

InnoDB是MySQL的資料庫引擎之一,現在是MySQL的預設儲存引擎,為MySQL AB發布binary的標準之一;InnoDB採用雙軌制授權,一個是GPL授權,另一個是專有軟體授權。 InnoDB是事務型資料庫的首選引擎,支援事務安全表(ACID);InnoDB支援行級鎖,行級鎖可以最大程度的支援並發,行級鎖是由儲存引擎層實現的。

InnoDB是將表中的資料儲存到磁碟上的儲存引擎,所以即使關機後重新啟動我們的資料還是存在的。而真正處理資料的過程是發生在記憶體中的,所以需要把磁碟中的資料載入到記憶體中,如果是處理寫入或修改請求的話,還需要把記憶體中的內容刷新到磁碟上。而我們知道讀寫磁碟的速度非常慢,和記憶體讀寫差了幾個數量級,所以當我們想從表中獲取某些記錄時,InnoDB儲存引擎需要一條一條的把記錄從磁碟上讀出來麼? InnoDB採取的方式是:將資料分割成若干個頁,以頁作為磁碟和記憶體之間互動的基本單位,InnoDB中頁的大小一般為16

一、回退重新裝mysql為避免再從其他地方導入這個資料的麻煩,先對目前庫的資料庫檔案做了個備份(/var/lib/mysql/位置)。接下來將Perconaserver5.7包進行了卸載,重新安裝原先老的5.1.71的包,啟動mysql服務,提示Unknown/unsupportedtabletype:innodb,無法正常啟動。 11050912:04:27InnoDB:Initializingbufferpool,size=384.0M11050912:04:27InnoDB:Complete

MySQL儲存引擎選用比較:InnoDB、MyISAM與Memory效能指標評估引言:在MySQL資料庫中,儲存引擎的選擇對於系統效能和資料完整性起著至關重要的作用。 MySQL提供了多種儲存引擎,其中最常用的引擎包括InnoDB、MyISAM和Memory。本文將就這三種儲存引擎進行效能指標評估,並透過程式碼範例進行比較。一、InnoDB引擎InnoDB是My

1.Mysql的事務隔離級別這四種隔離級別,當存在多個事務並發衝突的時候,可能會出現髒讀,不可重複讀,幻讀的一些問題,而innoDB在可重複讀隔離級別模式下解決了幻讀的一個問題,2.什麼是幻讀幻讀是指在同一個事務中,前後兩次查詢相同範圍的時候得到的結果不一致如圖,第一個事務裡面,我們執行一個範圍查詢,這時候滿足條件的資料只有一條,而在第二個事務裡面,它插入一行資料並且進行了提交,接著第一個事務再去查詢的時候,得到的結果比第一次查詢的結果多出來一條數據,注意第一個事務的第一次和第二次查詢,都在同

InnoDB的全文搜索功能非常强大,能够显著提高数据库查询效率和处理大量文本数据的能力。1)InnoDB通过倒排索引实现全文搜索,支持基本和高级搜索查询。2)使用MATCH和AGAINST关键字进行搜索,支持布尔模式和短语搜索。3)优化方法包括使用分词技术、定期重建索引和调整缓存大小,以提升性能和准确性。

MySQL是一款廣泛使用的資料庫管理系統,不同的儲存引擎對資料庫效能有不同的影響。 MyISAM和InnoDB是MySQL中最常用的兩種儲存引擎,它們的特性各有不同,使用不當可能會影響資料庫的效能。本文將介紹如何使用這兩種儲存引擎來最佳化MySQL效能。一、MyISAM儲存引擎MyISAM是MySQL最常使用的儲存引擎,它的優點是速度快,儲存佔用空間小。 MyISA

提升MySQL儲存引擎讀取效能的技巧與策略:MyISAM與InnoDB比較分析引言:MySQL是最常用的開源關係型資料庫管理系統之一,主要用於儲存和管理大量結構化資料。在應用中,對於資料庫的讀取效能往往是非常重要的,因為讀取操作是大部分應用的主要操作類型。本文將聚焦在如何提升MySQL儲存引擎的讀取效能,並著重分析MyISAM和InnoDB這兩個常用的存
