用索引提高MySQL性能並解釋-php教程-PHP中文網

MySQL Performance Boosting with Indexes and Explain

關鍵要點

使用MySQL的EXPLAIN命令分析和優化查詢執行計劃，通過揭示連接類型和索引使用等關鍵信息，確保更高效的數據庫操作。
實施查詢分析來衡量查詢的實際運行時間，從而進行有針對性的優化，以減少執行時間並提高整體性能。
根據EXPLAIN命令的反饋添加合適的索引，重點關注WHERE子句中使用的列，以加快數據檢索速度並提高查詢性能。
對於搜索操作中涉及的列，考慮使用全文索引來優化性能，尤其是在查詢中使用LIKE運算符時。
注意ORDER BY與LIMIT組合使用的情況，因為它可能會抵消限制結果的性能優勢，尤其是在沒有有效使用索引的情況下。

數據庫優化通常是提升應用性能的首要關注點，也是最常見的瓶頸。如何衡量和理解需要改進的地方？

一個簡單而有效的工具是查詢分析。啟用分析可以更準確地估計查詢的運行時間。這是一個兩步過程：首先，啟用分析；然後，調用show profiles來獲取查詢運行時間。

假設數據庫中存在以下插入操作（並假設用戶1和圖庫1已創建）：

INSERT INTO `homestead`.`images` (`id`, `gallery_id`, `original_filename`, `filename`, `description`) VALUES
(1, 1, 'me.jpg', 'me.jpg', 'A photo of me walking down the street'),
(2, 1, 'dog.jpg', 'dog.jpg', 'A photo of my dog on the street'),
(3, 1, 'cat.jpg', 'cat.jpg', 'A photo of my cat walking down the street'),
(4, 1, 'purr.jpg', 'purr.jpg', 'A photo of my cat purring');

登入後複製

少量數據不會造成問題，但我們可以用它來進行簡單的分析。考慮以下查詢：

SELECT * FROM `homestead`.`images` AS i
WHERE i.description LIKE '%street%';

登入後複製

如果照片條目很多，此查詢將來可能會成為問題。

要獲取此查詢的準確運行時間，可以使用以下SQL：

set profiling = 1;
SELECT * FROM `homestead`.`images` AS i
WHERE i.description LIKE '%street%';
show profiles;

登入後複製

結果如下所示：

Query_Id	Duration	Query
1	0.00016950	SHOW WARNINGS
2	0.00039200	SELECT * FROM homestead.images AS i WHERE i.description LIKE '%street%' LIMIT 0, 1000
3	0.00037600	SHOW KEYS FROM homestead.images
4	0.00034625	SHOW DATABASES LIKE 'homestead'
5	0.00027600	SHOW TABLES FROM homestead LIKE 'images'
6	0.00024950	SELECT * FROM homestead.images WHERE 0=1
7	0.00104300	SHOW FULL COLUMNS FROM homestead.images LIKE 'id'

show profiles;命令不僅顯示原始查詢的時間，還顯示所有其他查詢的時間，從而可以準確地分析查詢。

如何改進查詢？

可以依靠SQL知識進行改進，或者依靠MySQL的EXPLAIN命令並根據實際信息來提高查詢性能。

EXPLAIN用於獲取查詢執行計劃，即MySQL如何執行查詢。它適用於SELECT、DELETE、INSERT、REPLACE和UPDATE語句，並顯示優化器關於語句執行計劃的信息。官方文檔很好地描述了EXPLAIN如何幫助我們：

通過EXPLAIN，您可以看到應該在哪些表中添加索引，以便語句通過使用索引查找行來更快地執行。您還可以使用EXPLAIN來檢查優化器是否以最佳順序連接表。

為了舉例說明EXPLAIN的使用，我們將使用UserManager.php中查找用戶電子郵件的查詢：

INSERT INTO `homestead`.`images` (`id`, `gallery_id`, `original_filename`, `filename`, `description`) VALUES
(1, 1, 'me.jpg', 'me.jpg', 'A photo of me walking down the street'),
(2, 1, 'dog.jpg', 'dog.jpg', 'A photo of my dog on the street'),
(3, 1, 'cat.jpg', 'cat.jpg', 'A photo of my cat walking down the street'),
(4, 1, 'purr.jpg', 'purr.jpg', 'A photo of my cat purring');

登入後複製

要使用EXPLAIN命令，只需在SELECT類型查詢之前添加它：

SELECT * FROM `homestead`.`images` AS i
WHERE i.description LIKE '%street%';

登入後複製

結果如下（向右滾動查看所有內容）：

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	SIMPLE	users	NULL	const	UNIQ_1483A5E9E7927C74	UNIQ_1483A5E9E7927C74	182	const	1	100.00	NULL

這些結果一開始不容易理解，讓我們仔細看看每一個：

id：這是SELECT中每個查詢的順序標識符。
select_type：SELECT查詢的類型。此字段可以取多個不同的值，因此我們將關注最重要的幾個：
- SIMPLE：沒有子查詢或聯合的簡單查詢
- PRIMARY：select位於連接中最外層的查詢中
- DERIVED：select是from中子查詢的一部分
- SUBQUERY：子查詢中的第一個select
- UNION：select是聯合的第二個或後續語句。完整的select_type字段值列表可以在此處找到。
table：行引用的表。
type：此字段表示MySQL連接所用表的類型。這可能是EXPLAIN輸出中最重要的字段。它可以指示缺少索引，也可以顯示如何重寫查詢。此字段的可能值如下（從最佳類型到最差類型排序）：
- system：表具有零行或一行。
- const：表只有一行匹配行，該行已編入索引。這是最快的連接類型。
- eq_ref：索引的所有部分都由連接使用，並且索引是PRIMARY_KEY或UNIQUE NOT NULL。
- ref：對於來自前一張表的每一行組合，都會讀取索引列的所有匹配行。這種類型的連接通常出現在使用=或運算符比較的已編入索引的列中。
- fulltext：連接使用表的全文索引。
- ref_or_null：與ref相同，但也包含來自列的NULL值的行。
- index_merge：連接使用索引列表來生成結果集。 EXPLAIN的KEY列將包含所使用的鍵。
- unique_subquery：IN子查詢僅從表中返回一個結果，並使用主鍵。
- range：使用索引在特定範圍內查找匹配的行。
- index：掃描整個索引樹以查找匹配的行。
- ALL：掃描整個表以查找連接的匹配行。這是最差的連接類型，通常表示表上缺少合適的索引。
possible_keys：顯示MySQL可用於從表中查找行的鍵。這些鍵在實踐中可能被使用，也可能不被使用。
keys：指示MySQL實際使用的索引。 MySQL始終查找可用於查詢的最佳鍵。連接多個表時，它可能會找到一些不在possible_keys中列出但更優的鍵。
key_len：指示查詢優化器選擇使用的索引的長度。
ref：顯示與key列中命名的索引進行比較的列或常量。
rows：列出為生成輸出而檢查的記錄數。這是一個非常重要的指標；檢查的記錄越少越好。
Extra：包含其他信息。此列中的Using filesort或Using temporary等值可能表示有問題的查詢。

EXPLAIN輸出格式的完整文檔可以在MySQL官方頁面上找到。

回到我們的簡單查詢：它是一種SIMPLE類型的select，具有const類型的連接。這是我們可能擁有的最佳查詢案例。但是，當我們需要更大更複雜的查詢時會發生什麼？

回到我們的應用程序模式，我們可能想要獲取所有圖庫圖像。我們可能還只想包含描述中包含單詞“cat”的照片。這絕對是我們可以在項目需求中找到的情況。讓我們看看查詢：

INSERT INTO `homestead`.`images` (`id`, `gallery_id`, `original_filename`, `filename`, `description`) VALUES
(1, 1, 'me.jpg', 'me.jpg', 'A photo of me walking down the street'),
(2, 1, 'dog.jpg', 'dog.jpg', 'A photo of my dog on the street'),
(3, 1, 'cat.jpg', 'cat.jpg', 'A photo of my cat walking down the street'),
(4, 1, 'purr.jpg', 'purr.jpg', 'A photo of my cat purring');

登入後複製

在這個更複雜的情況下，我們應該在EXPLAIN中獲得更多信息來分析：

SELECT * FROM `homestead`.`images` AS i
WHERE i.description LIKE '%street%';

登入後複製

這將給出以下結果（向右滾動查看所有單元格）：

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	SIMPLE	users	NULL	index	PRIMARY,UNIQ_1483A5E9BF396750	UNIQ_1483A5E9BF396750	108	NULL	1	100.00	Using index
1	SIMPLE	gal	NULL	ref	PRIMARY,UNIQ_F70E6EB7BF396750,IDX_F70E6EB7A76ED395	UNIQ_1483A5E9BF396750	108	homestead.users.id	1	100.00	NULL
1	SIMPLE	img	NULL	ref	IDX_E01FBE6A4E7AF8F	IDX_E01FBE6A4E7AF8F	109	homestead.gal.id	1	25.00	Using where

讓我們仔細看看，看看我們可以在查詢中改進什麼。

如前所述，首先應該查看的主要列是type列和rows列。目標應該是獲得type列中更好的值，並儘可能減少rows列的值。

第一個查詢的結果是index，這根本不是一個好結果。這意味著我們可能可以改進它。

查看我們的查詢，有兩種方法可以解決它。首先，Users表沒有被使用。我們要么擴展查詢以確保我們正在定位用戶，要么應該完全刪除查詢的用戶部分。它只會增加我們整體性能的複雜性和時間。

INSERT INTO `homestead`.`images` (`id`, `gallery_id`, `original_filename`, `filename`, `description`) VALUES
(1, 1, 'me.jpg', 'me.jpg', 'A photo of me walking down the street'),
(2, 1, 'dog.jpg', 'dog.jpg', 'A photo of my dog on the street'),
(3, 1, 'cat.jpg', 'cat.jpg', 'A photo of my cat walking down the street'),
(4, 1, 'purr.jpg', 'purr.jpg', 'A photo of my cat purring');

登入後複製

所以現在我們得到了完全相同的結果。讓我們看看EXPLAIN：

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	SIMPLE	gal	NULL	ALL	PRIMARY,UNIQ_1483A5E9BF396750	NULL	NULL	NULL	1	100.00	NULL
1	SIMPLE	img	NULL	ref	IDX_E01FBE6A4E7AF8F	IDX_E01FBE6A4E7AF8F	109	homestead.gal.id	1	25.00	Using where

我們剩下的是ALL類型。雖然ALL可能是最差的連接類型，但也有一些情況下它是唯一的選擇。根據我們的要求，我們想要所有圖庫圖像，因此我們需要搜索整個galleries表。當我們需要表中的所有信息時，索引在嘗試查找表中的特定信息時非常好，但它們幫不了我們。當我們遇到這種情況時，我們必須求助於其他方法，例如緩存。

由於我們正在處理LIKE，我們可以做的最後一個改進是向我們的description字段添加全文索引。這樣，我們可以將LIKE更改為match()並提高性能。更多關於全文索引的信息可以在此處找到。

我們還必須查看兩個非常有趣的情況：應用程序中最新的和相關的功能。這些適用於圖庫，並涉及我們應該注意的一些極端情況：

INSERT INTO `homestead`.`images` (`id`, `gallery_id`, `original_filename`, `filename`, `description`) VALUES
(1, 1, 'me.jpg', 'me.jpg', 'A photo of me walking down the street'),
(2, 1, 'dog.jpg', 'dog.jpg', 'A photo of my dog on the street'),
(3, 1, 'cat.jpg', 'cat.jpg', 'A photo of my cat walking down the street'),
(4, 1, 'purr.jpg', 'purr.jpg', 'A photo of my cat purring');

登入後複製

以上是相關圖庫。

SELECT * FROM `homestead`.`images` AS i
WHERE i.description LIKE '%street%';

登入後複製

以上是最新的圖庫。

乍一看，這些查詢應該非常快，因為它們使用的是LIMIT。在大多數使用LIMIT的查詢中都是這種情況。不幸的是，對於我們和我們的應用程序來說，這些查詢也使用了ORDER BY。因為我們需要在限制查詢之前對所有結果進行排序，所以我們失去了使用LIMIT的優勢。

由於我們知道ORDER BY可能很棘手，讓我們應用我們可靠的EXPLAIN。

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	SIMPLE	gal	NULL	ALL	IDX_F70E6EB7A76ED395	NULL	NULL	NULL	1	100.00	Using where; Using filesort
1	SIMPLE	u	NULL	eq_ref	PRIMARY,UNIQ_1483A5E9BF396750	PRIMARY	108	homestead.gal.id	1	100.00	NULL

以及，

id	select_type	table	partitions	type	possible_keys	key	key_len	ref	rows	filtered	Extra
1	SIMPLE	gal	NULL	ALL	NULL	NULL	NULL	NULL	1	100.00	Using filesort

我們可以看到，對於我們的兩個查詢，我們都有最糟糕的連接類型：ALL。

歷史上，MySQL的ORDER BY實現，特別是與LIMIT一起使用時，通常是MySQL性能問題的根源。這種組合也用於大多數具有大型數據集的交互式應用程序。像新註冊用戶和熱門標籤這樣的功能通常使用這種組合。

因為這是一個常見問題，所以我們還應該應用一些常見的解決方案來解決性能問題。

確保我們正在使用索引。在我們的例子中，created_at是一個很好的候選者，因為它是我們正在排序的字段。這樣，我們就可以在不掃描和排序完整結果集的情況下執行ORDER BY和LIMIT。
按前導表中的列排序。通常，如果ORDER BY按不是連接順序中的第一個表的字段進行排序，則無法使用索引。
不要按表達式排序。表達式和函數不允許ORDER BY使用索引。
注意大的LIMIT值。大的LIMIT值將強制ORDER BY對更多行進行排序。這會影響性能。

當我們同時使用LIMIT和ORDER BY時，這些是我們應該採取的一些措施，以最大限度地減少性能問題。

結論

正如我們所看到的，EXPLAIN對於儘早發現查詢中的問題非常有用。有很多問題只有當我們的應用程序處於生產環境中並且有大量數據或大量訪問者訪問數據庫時才會注意到。如果可以使用EXPLAIN儘早發現這些問題，那麼將來出現性能問題的可能性就小得多。

我們的應用程序擁有所有需要的索引，並且速度很快，但我們現在知道，每當我們需要檢查性能提升時，我們總是可以求助於EXPLAIN和索引。

關於MySQL性能索引的常見問題解答(FAQ)

MySQL性能索引的重要性是什麼？

MySQL性能索引對於優化數據庫性能至關重要。它們通過根據已編入索引的列中的值快速訪問數據表中的行，顯著加快數據檢索操作。如果沒有索引，MySQL將不得不遍歷表中的每一行才能找到相關的行，這可能會非常耗時，尤其對於大型數據庫而言。

EXPLAIN命令如何幫助提高MySQL性能？

MySQL中的EXPLAIN命令是一個強大的工具，它提供有關MySQL如何執行查詢的信息。它顯示讀取表的順序、執行的讀取操作類型、可選擇的索引以及要檢查的估計行數。這些信息可以幫助開發人員優化查詢並提高數據庫性能。

為什麼MySQL不使用任何可能的鍵？

MySQL不使用任何可能的鍵可能有幾個原因。一個原因可能是優化器估計使用索引需要掃描表的大部分，並決定表掃描會更快。另一個原因可能是WHERE子句中的列與索引中的列不匹配。

如何優化我的MySQL查詢？

有幾種方法可以優化MySQL查詢。一種方法是有效地使用索引。索引可以顯著加快數據檢索速度。但是，它們會減慢數據修改操作（如INSERT、UPDATE和DELETE）的速度。因此，找到平衡點非常重要。另一種方法是使用EXPLAIN命令來了解MySQL如何執行查詢並查找潛在的瓶頸。

MySQL中主鍵和索引的區別是什麼？

MySQL中的主鍵是一種索引。主鍵是表中行的唯一標識符。它強制執行列或列組合的唯一性，並確保列或列組合不包含NULL值。另一方面，索引是一種數據結構，它可以提高數據檢索操作的速度。它可以應用於任何列或列的組合。

如何在MySQL中創建索引？

可以使用CREATE INDEX語句在MySQL中創建索引。語法如下：CREATE INDEX index_name ON table_name (column1, column2, …);。這將在指定表的指定列上創建一個索引。

MySQL中的複合索引是什麼？

複合索引，也稱為多列索引，是一個包含多列的索引。在MySQL中，複合索引最多可以包含16列，但已編入索引的列的總大小不能超過767字節。

如何在MySQL中刪除索引？

可以使用DROP INDEX語句在MySQL中刪除索引。語法如下：DROP INDEX index_name ON table_name;。這將從指定的表中刪除指定的索引。

MySQL中聚集索引和非聚集索引的區別是什麼？

聚集索引決定表中數據的物理順序。每個表只能有一個聚集索引。另一方面，非聚集索引不會更改表中數據的物理順序。相反，它維護一個指向數據行的單獨數據結構（索引），從而允許更快地檢索數據。

MySQL如何選擇要使用的索引？

MySQL使用基於成本的優化器來選擇要使用的索引。優化器會估計不同查詢執行計劃的成本，並選擇成本最低的計劃。成本是根據要讀取的行數、磁盤查找次數、CPU成本和內存使用情況等因素來估計的。

以上是用索引提高MySQL性能並解釋的詳細內容。更多資訊請關注PHP中文網其他相關文章！