一个用户迁移数据库前后的性能差异case_MySQL
问题
一个用户问题,数据从ECS迁移到RDS,相同的语句,查询性能下降了几十倍。而实际上RDS这个实例在内存上的配置与原来ECS上的实例相当。
<code style="padding: 0px; font-family: inherit; font-size: 14px; color: inherit; border-top-left-radius: 3px; border-top-right-radius: 3px; border-bottom-right-radius: 3px; border-bottom-left-radius: 3px; background-color: transparent; border: 0px; font-style: inherit; font-weight: inherit;">本文简单说明这个case的原因及建议。用户反馈性能变慢的语句为 (修改了真实表明和列名)select count(1)from HR hr join H h on h.hid = hr.hid join A e one.aid = h.eid join A t on t.aid = e.pid join A c on c.aid = t.pid join A p on p.aid = c.pidleft join U u on u.uid = hr.uId left join E emp on emp.eid = hr.oid where( hr.s in (1,2,3,4)and hr.cn = 0 );</code>
背景
<code style="padding: 0px; font-family: inherit; font-size: 14px; color: inherit; border-top-left-radius: 3px; border-top-right-radius: 3px; border-bottom-right-radius: 3px; border-bottom-left-radius: 3px; background-color: transparent; border: 0px; font-style: inherit; font-weight: inherit;">MySQL执行语句过程中涉及到两大流程:优化器和执行器。其中优化器最主要的任务,是选择索引和在多表连接时选择连接顺序。在这个case中,join顺序的选择影响了执行性能。确定join执行顺序就需要估算所有join操作的代价。默认配置下MySQL会估算所有可能的组合。MySQL Tips: MySQL里限制一个查询的join表数目上限为61.对于一个有61个表参与的join操作,理论上需要61!(阶乘)次的评估。当然这是最坏情况下,实际上减枝算法会让这个数字看起来稍微好一点,但是仍然很恐怖。在多表join的场景下,为了避免优化器占用太多时间,MySQL提供了一个参数 optimizer_search_depth 来控制递归深度。这个参数对算法的控制可以简单描述为:对于所有的排列,只取前当前join顺序的前optimizer_search_depth个表估算代价。举例来说,20张表的,假设optimizer_search_depth为4,那么评估次数为20*19*18*17,虽然也很大(因此我们特别不建议这么多表的join),比20!好多了。于是optimizer_search_depth的选择就成了问题。</code>
<code style="padding: 0px; font-family: inherit; font-size: 14px; color: inherit; border-top-left-radius: 3px; border-top-right-radius: 3px; border-bottom-right-radius: 3px; border-bottom-left-radius: 3px; background-color: transparent; border: 0px; font-style: inherit; font-weight: inherit;">MySQL Tips: MySQL中optimizer_search_depth默认值为62.也就是说默认为全排列计算。</code>
<code style="padding: 0px; font-family: inherit; font-size: 14px; color: inherit; border-top-left-radius: 3px; border-top-right-radius: 3px; border-bottom-right-radius: 3px; border-bottom-left-radius: 3px; background-color: transparent; border: 0px; font-style: inherit; font-weight: inherit;">这样能够保证得到最优的执行计划,只是在有些场景下,决定执行计划的时间会远大于执行时间本身。</code>
量化分析
在ECS上,是用户自己维护的MySQL,没有设置optimizer_search_depth,因此为默认的62.
在RDS上,我们的配置是4。
分析到这里大家能猜到原因是RDS配置的4导致没有得到最优的执行计划。
<code style="padding: 0px; font-family: inherit; font-size: 14px; color: inherit; border-top-left-radius: 3px; border-top-right-radius: 3px; border-bottom-right-radius: 3px; border-bottom-left-radius: 3px; background-color: transparent; border: 0px; font-style: inherit; font-weight: inherit;">下图是optimizer_search_depth=4时的explain结果(隐藏了业务相关的表名、字段名)<img src="/static/imghw/default1.png" data-src="http://img.bitscn.com/upimg/allimg/c140719/1405KJ0BGZ-21153.jpg" class="lazy" alt="alt" style="max-width:90%">下图是optimizer_search_depth=62是的场景,当然这个case的join表是8个,因此62和8在这里是等效的。<img src="/static/imghw/default1.png" data-src="http://img.bitscn.com/upimg/allimg/c140719/1405KJ0G0940-33412.jpg" class="lazy" alt="alt" style="max-width:90%">从图1可以看到,由于optimizer_search_depth=4,优化器认为自己选择了最优的join顺序(22039*1*1*1),优于(41360*1*1*1),而实际上后者才是全局最优。有趣的是,在这个case里面如果多看一层,就能得到最有解,因为第一个join顺序的第五个表评估rows为82720。这意味着,在这个case里面,设置为5与设置为62能得到相同的执行计划,当然设置为5时的优化器执行代价更小。这其实也就是提供optimizer_search_depth的本意:减少优化器执行时间,而且概率上还存在局部最优就是全局最优解的情况。</code>
关于实践
可配置的参数提供灵活性的同时,也提出一个头疼的问题:应该设置为多少才合适。
实际上当用户执行一个多表join的时候,对这个语句的整体RT的期望值就不会高。因此可以先定义一个预期,比如优化器决策join顺序的时间不能超过500ms。
用户规格与cpu相关,因此这个只能是建议值。
用户实践
实际上更重要的是对于用户来说:
<code style="padding: 0px; font-family: inherit; font-size: 14px; color: inherit; border-top-left-radius: 3px; border-top-right-radius: 3px; border-bottom-right-radius: 3px; border-bottom-left-radius: 3px; background-color: transparent; border: 0px; font-style: inherit; font-weight: inherit;">1) 当出现实例迁移后,多表join执行结果差异较大的时候,要考虑调整这个值。该参数是允许线程单独设置,因此对于应用层来说,每个连接应该都能得到一个较优的值。2) 反过来,当设置为默认的optimizer_search_depth=62时,我们我们如何评估我们这个设置是否过大?MySQL Tips:MySQL profiling 可以用于查看各执行环节的消耗时间。如下是笔者构造的一个60个表join查询的查询,使用profiling查看执行环节消耗的过程。set profiling=1;set optimizer_search_depth=4;explain select .......show profile for query 2; 结果如图<img src="/static/imghw/default1.png" data-src="http://img.bitscn.com/upimg/allimg/c140719/1405KJ0JDP-4T62.jpg" class="lazy" alt="alt" style="max-width:90%">继续执行set optimizer_search_depth=40;explain select .......show profile for query 4; <img src="/static/imghw/default1.png" data-src="http://img.bitscn.com/upimg/allimg/c140719/1405KJ0MQ20-525A.jpg" class="lazy" alt="alt" style="max-width:90%">图中标红部分显示了两次优化器的执行时间差异。</code>
小结
<code style="padding: 0px; font-family: inherit; font-size: 14px; color: inherit; border-top-left-radius: 3px; border-top-right-radius: 3px; border-bottom-right-radius: 3px; border-bottom-left-radius: 3px; background-color: transparent; border: 0px; font-style: inherit; font-weight: inherit;">1)根据机器配置估算一个可接受的时间,用于优化器选择join顺序。2)用profiling确定是否设置了过大的optimizer_search_depth。3)业务上优化,尽量不要使用超过10张表的多表join。4)PS:不要相信银弹。MySQL文档说设置为0则表示能够自动选择</code>optimizer_search_depth的合理值,实际上代码上策略就是,如果join表数N

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

Go語言是一種高效、簡潔且易於學習的程式語言,因其在並發程式設計和網路程式設計方面的優勢而備受開發者青睞。在實際開發中,資料庫操作是不可或缺的一部分,本文將介紹如何使用Go語言實作資料庫的增刪改查操作。在Go語言中,我們通常會使用第三方函式庫來操作資料庫,例如常用的sql套件、gorm等。這裡以sql包為例介紹如何實作資料庫的增刪改查操作。假設我們使用的是MySQL資料庫。

Hibernate多態映射可映射繼承類別到資料庫,提供以下映射類型:joined-subclass:為子類別建立單獨表,包含父類別所有欄位。 table-per-class:為子類別建立單獨資料表,僅包含子類別特有列。 union-subclass:類似joined-subclass,但父類別表聯合所有子類別列。

蘋果公司最新發布的iOS18、iPadOS18以及macOSSequoia系統為Photos應用程式增添了一項重要功能,旨在幫助用戶輕鬆恢復因各種原因遺失或損壞的照片和影片。這項新功能在Photos應用的"工具"部分引入了一個名為"已恢復"的相冊,當用戶設備中存在未納入其照片庫的圖片或影片時,該相冊將自動顯示。 "已恢復"相簿的出現為因資料庫損壞、相機應用未正確保存至照片庫或第三方應用管理照片庫時照片和視頻丟失提供了解決方案。使用者只需簡單幾步

如何在PHP中使用MySQLi建立資料庫連線:包含MySQLi擴充(require_once)建立連線函數(functionconnect_to_db)呼叫連線函數($conn=connect_to_db())執行查詢($result=$conn->query())關閉連線( $conn->close())

PHP處理資料庫連線報錯,可以使用下列步驟:使用mysqli_connect_errno()取得錯誤代碼。使用mysqli_connect_error()取得錯誤訊息。透過擷取並記錄這些錯誤訊息,可以輕鬆識別並解決資料庫連接問題,確保應用程式的順暢運作。

HTML無法直接讀取資料庫,但可以透過JavaScript和AJAX實作。其步驟包括建立資料庫連線、發送查詢、處理回應和更新頁面。本文提供了利用JavaScript、AJAX和PHP來從MySQL資料庫讀取資料的實戰範例,展示如何在HTML頁面中動態顯示查詢結果。此範例使用XMLHttpRequest建立資料庫連接,發送查詢並處理回應,從而將資料填入頁面元素中,實現了HTML讀取資料庫的功能。

PHP是一種廣泛應用於網站開發的後端程式語言,它具有強大的資料庫操作功能,常用於與MySQL等資料庫進行互動。然而,由於中文字元編碼的複雜性,在處理資料庫中文亂碼時常常會出現問題。本文將介紹PHP處理資料庫中文亂碼的技巧與實踐,包括常見的亂碼原因、解決方法和具體的程式碼範例。常見的亂碼原因資料庫字元集設定不正確:資料庫建立時需選擇正確的字元集,如utf8或u

透過Go標準庫database/sql包,可以連接到MySQL、PostgreSQL或SQLite等遠端資料庫:建立包含資料庫連接資訊的連接字串。使用sql.Open()函數開啟資料庫連線。執行SQL查詢和插入操作等資料庫操作。使用defer關閉資料庫連線以釋放資源。
