又是新的一周,各位週一好。
由於換工作,找房子這一系列事情都推在了一起,所以最近停更了一個多月。現在所有的事情都已塵埃落定,我也可以安安靜靜的碼字啦。
好了,也不多說,開始新的旅程啦。最近一直在看《MySQL技術內幕-InnoDB儲存引擎》這本書,也剛好記錄下吧。
我們先來看看MySQL的架構圖,對其先有一個整體的了解。 MySQL主要分為四層架構,分別是網路連接層,服務層,儲存引擎層,實體層。我們平常寫的SQL語句,以及對SQL語句的最佳化都在服務層,他其實就是遵循一定的原則讓SQL語句能夠依照我們的預期效果執行。
主要負責連線管理,授權認證,安全性等。每個客戶端連線都對應著伺服器上的一個執行緒。伺服器上維護一個執行緒池,避免為每個連線建立和銷毀執行緒。當客戶端連接到MySQL伺服器時,伺服器對其進行認證。可以透過使用者名稱與密碼認證,也可以透過SSL憑證進行認證。登入認證後,伺服器也會驗證用戶端是否有執行某個查詢的操作權限。這一層並不是MySQL所特有的技術。
該層是MySQL的核心,包括查詢緩存,解析器,解析樹,預處理器,查詢最佳化器。
查詢快取
#在正式查詢之前,伺服器會檢查查詢緩存,如果能找到對應的查詢,則不必進行查詢解析,優化,執行等過程,直接傳回快取中的結果集。
解析器與預處理器
#MySQL的解析器會根據查詢語句,建構出一個解析樹,主要用於根據語法規則來驗證語句是否正確,例如SQL的關鍵字是否正確,關鍵字的順序是否正確。
而預處理器主要是進一步校驗,例如表名,欄位名稱是否正確等。
查詢最佳化器
查詢最佳化器將解析樹轉換為查詢計劃,一般情況下,一條查詢可以有很多種執行方式,最終傳回相同的結果,優化器就是找到這其中最優的執行計劃
#執行計劃
在完成解析和最佳化階段後,MySQL會根據對應的執行計畫去呼叫儲存引擎層提供的對應介面來取得結果。
負責MySQL資料的儲存和擷取,是透過提供一系列的介面來屏蔽不同引擎之間的差異。
注意:儲存引擎是針對資料表的,而不是針對函式庫。也就是說同一個庫裡面的不同表格可以有不同的儲存引擎。
常見的儲存引擎有兩種,MyISAM和InnoDB,下面我們來看他們的差異。
首先,我們先建立一個儲存引擎為MyISAM的test1表。
create table test1( a INTEGER, b varchar(10) )ENGINE=MyISAM;
我們可以去MySQL的相關目錄看一下他實際儲存的內容,發現他對應著三個檔案。
其次,我們再建立一個儲存引擎為InnoDB的test2表。
create table test2( a INTEGER, b varchar(10) )ENGINE=INNODB;
我們再去看他實際儲存的內容,發現他對應這一個檔案。
那麼問題就來了,他的資料檔案和索引檔案存放在哪裡啦。這邊先留個問題,下篇"文件"再說。
將資料存放在硬碟上。
我們傳送一條SQL語句,在MySQL中的整體流程究竟是什麼樣的?
使用者先透過Navicat等客戶端與服務端建立連接,這邊需要使用者名稱和密碼進行認證,也可以用SSL憑證進行認證。
登入成功後,MySQL會根據對應權限來判斷角色是否擁有一些表格的權限等。
如果擁有相關權限,當使用者發送一條查詢select語句時,MySQL先查詢緩存,如果已經有這條語句的緩存,則直接傳回,如果沒有則執行下面的流程。如果是更新update,新增insert,刪除delete則不查詢緩存,直接執行下面的流程。
MySQL會將SQL語句解析為樹,然後對其進行校驗,例如關鍵字是否正確,關鍵字順序是否正確,表名是否正確,欄位是否正確等。如果認證沒有成功,則直接傳回錯誤。如果認證成功了,則直接下面流程。
MySQL對解析樹進行查詢最佳化,因為多個SQL可能表達的意思一樣,但消耗的時間可能差異很大。所以MySQL對針對表的儲存引擎找到最優的語句執行,也就是產生對應的執行計畫。
使用上面產生的執行計劃,來呼叫儲存引擎層的介面。也就是我們平常使用的explain,其可以用來查看是否走索引,消耗的時間等資訊。
不同的儲存引擎會到對應的實體儲存位置,找到對應的數據,封裝並傳回結果。
如果拿到了結果集,並且為select語句,MySQL會將結果放入到快取中,避免下次再進行相同的操作而造成資源的消耗,同時傳回給客戶端結果,至此,一條SQL語句的執行過程結束啦。
更多MySQL相關技術文章,請造訪MySQL教學欄位進行學習!
以上是淺談MySQL的整體架構的詳細內容。更多資訊請關注PHP中文網其他相關文章!