MySQL中由load data语句引起死锁的解决案例-mysql教程-PHP中文網

首頁

資料庫

mysql教程

MySQL中由load data语句引起死锁的解决案例

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2016 am 09:57 AM

innodb mysql 死鎖

一个线上项目报的死锁，简要说明一下产生原因、处理方案和相关的一些点.

1、背景

这是一个类似数据分析的项目，数据完全通过LOAD DATA语句导入一个InnoDB表中。为方便描述，表结构简化为如下：

<code class="sql">Create table tb(id int primary key auto_increment, c int not null) engine=innodb;
</code>

登入後複製

导入数据的语句对应为

<code class="sql">Load data infile ‘data1.csv' into table tb;
 
Load data infile ‘data2.csv' into table tb;</code>

登入後複製

产生死锁的证据是在show engine innodb status的LATEST DETECTED DEADLOCK段中看到死锁信息

说明

从上面表格中看出，事务1在等待某一行的锁。而事务2持有这行的锁，但等待表的自增锁（AUTO_INC），判断为死锁，事务回滚。
这里事务1没有写出来，但是可以推断，事务1持有这个表的自增锁（否则就不是死锁了）。

2、背景知识1：AUTO_INC lock 及其选项

在InnoDB表中，若存在自增字段，则会维护一个表级别的锁，这里称为自增锁。每次插入新数据，或者update语句修改了此字段，都会需要获取这个锁

由于一个事务可能包含多个语句，而并非所有的语句都与自增字段有关，因此InnoDB作了一个特殊的处理，自增锁在一个语句结束后马上被释放。之所以说是特殊处理，是因为普通的锁，都是在事务结束后释放。

若一个表有自增字段，一个insert语句不指定该字段的值，或指定为NULL时，InnoDB会给它赋值为当前的AUTO_INCREMENT的值，然后AUTO_INCREMENT加1。

与这个自增锁相关的一个参数是innodb_autoinc_lock_mode. 默认值为1，可选为0,1,2。

我们先来看当这个值设置为0时，一个有自增字段的表，插入一行数据时的行为：

1) 申请AUTO_INC锁

2) 得到当前AUTO_INCREMNT值n，给AUTO_INCREMENT 加1

3) 执行插入操作，并将n填入新增的行对应字段中

4) 释放AUTO_INC锁

我们看到这个过程中，虽然InnoDB为了减少锁粒度，在语句执行完成就马上释放，但这锁还是太大了――它包括了插入操作的时间。这就导致了两个insert语句，实际上没办法并行。

没有这个参数之前，行为就是与设置为0相同，0这个选项就是留着兼容的。

很容易想到设置为1的时候，应该是将3) 和 4)对调。但是本文还是要讨论为0的情况，因为我们的前提是LOAD语句，而LOAD语句这类插入多行的语句中（包括insert …select …），即使设置为1也没用，会退化为0的模式。

3、背景知识2：LOAD DATA语句的主从行为

为什么插入多行的语句要即使将innodb_autoinc_lock_mode设置为1，也会用0的模式呢？

主要原因还是为了主从一致性。设想binlog_format='statement'，一个LOAD DATA语句在主库的binlog直接记录为语句本身，那从库如何重放：

1) 将load data用到的文件发给slave，slave将文件保存在临时目录。

2) 在slave也执行一次LOAD DATA语句。

其间有一个问题：slave怎么保证load data语句的自增id字段与master相同？

为了解决这个问题，主库的binlog中还有一个set SET INSERT_ID命令，表明这个LOAD DATA语句插入的第一行的自增ID值。这样slave在执行load data之前，先执行了这个set SET INSERT_ID语句，用于保证执行结果与主库一模一样。

上述的机制能保证主从数据一致的前提是：主从库上LOAD DATA语句生成的自增ID值必须是连续的。

4、背景知识1＋2：分析

回到前面说的模式0和1的区别，我们看到，如果AUTO_INC锁在整个语句开始之前就获取，在语句结束之后才释放，这样就能保证整个语句生成的id连续――模式0的保证。

对于1，每次拿到下一个值就释放，插入数据后，若需要再申请，则不连续。

这就是为什么，即使设置为1，对于多行操作，会退化成0。

至此我们知道这个死锁出现的原因，是这两个LOAD DATA语句不仅会访问相同的记录，还会访问同一个AUTO_INC锁，造成互相等待。

到此没完，因为我们知道虽然两个线程访问两个锁可能造成死锁，但是死锁还有另外一个条件，与申请顺序有关。既然AUTO_INC是一个表锁，不论谁先拿到，会阻塞其他同表的LOAD DATA的执行，又为什么会在某个记录上出现锁等待？

5、背景知识3：AUTO_INC的加锁时机

前面我们说到每次涉及到插入新数据，就会要求对AUTO_INC加锁，并列出了流程。但这个流程是对于需要从InnoDB中得到自增值来设置列值的情况。另一种情况是在语句中已经指定了该列的值。

比如对于这个表，执行 insert into tb values(9,100). 此时id的值已经明确是9，虽然不需要取值来填，但是插入这行后有可能需要改变AUTO_INCREMENT的值（若原来是

1）插入数据

2）若失败则流程结束

3）若成功，申请AUTO_INC锁

4）调用set_max….函数，如有必要则修改AUTO_INCREMENT

5）语句结束时释放AUTO_INC锁。

6、为什么修改AUTO_INC顺序

这么调整的好处是什么？主要是为了减少不必要的锁访问。若在插入数据期间发生错误，比如其他字段造成DUPLICATE KEY error，这样就不用访问AUTO_INC锁。

7、死锁过程复现

必须强调是“语句结束时”。这样我们来看一个每行都已经指定了自增列值的LOAD DATA语句的流程（也就是本文例子的情况）：

1) 插入第一条数据

2) 申请AUTO_INC锁

3) 插入第二条

4) 申请AUTO_INC 锁（因为已经是自己的，直接成功）

5) 。。。。。。插入剩余所有行

6) 释放AUTO_INC锁。

所以这个流程就简单描述为：插入第一行，申请AUTO_INC锁，然后插入剩下的所有行后再释放。

我们前面提到过，插入第一条数据时可能需要访问的记录锁，是要等到整个事务结束后才释放的.

有了上面的这些背景知识，我们来复现一下死锁出现的过程

可以看到触发条件还是比较苛刻的，尤其是session2要刚好要用到session1锁住的那个记录锁。需要说明，由于InnoDB内部对记录的表示，同一个记录锁并不表示主键值一定相同。

8、解决方案1：去掉不必要的AUTO_INCREMENT字段

在这个业务中，由于所有的数据都是通过LOAD DATA进去，而且都已经指定了自增字段的值，因此这个AUTO)INCREMENT属性是不需要的。

少了一个，就死锁不了了。

9、解决方案2：强制模式1

前面我们说到innodb_autoinc_lock_mode这个参数的可选值有0、1、2。当设置为1的时候，在LOAD DATA语句会退化为模式0。但若设置为2，则无论如何都会使用模式1。

我们前面说到使用模式1会导致LOAD DATA生成的自增id值不连续，这样会导致在binlog_format是1时主从不一致，因此设置为2的前提，是binlog_format 是row.

在binlog_format='row'时，设置innodb_autoinc_lock_mode为2是安全的。

若允许，方案2比方案1更轻量些，不需要修改数据和表结构。

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7535

CakePHP 教程

1379

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

mysql：簡單的概念，用於輕鬆學習 Apr 10, 2025 am 09:29 AM

MySQL是一個開源的關係型數據庫管理系統。 1）創建數據庫和表：使用CREATEDATABASE和CREATETABLE命令。 2）基本操作：INSERT、UPDATE、DELETE和SELECT。 3）高級操作：JOIN、子查詢和事務處理。 4）調試技巧：檢查語法、數據類型和權限。 5）優化建議：使用索引、避免SELECT*和使用事務。

phpmyadmin怎麼打開 Apr 10, 2025 pm 10:51 PM

可以通過以下步驟打開 phpMyAdmin：1. 登錄網站控制面板；2. 找到並點擊 phpMyAdmin 圖標；3. 輸入 MySQL 憑據；4. 點擊 "登錄"。

MySQL：世界上最受歡迎的數據庫的簡介 Apr 12, 2025 am 12:18 AM

MySQL是一種開源的關係型數據庫管理系統，主要用於快速、可靠地存儲和檢索數據。其工作原理包括客戶端請求、查詢解析、執行查詢和返回結果。使用示例包括創建表、插入和查詢數據，以及高級功能如JOIN操作。常見錯誤涉及SQL語法、數據類型和權限問題，優化建議包括使用索引、優化查詢和分錶分區。

為什麼要使用mysql？利益和優勢 Apr 12, 2025 am 12:17 AM

選擇MySQL的原因是其性能、可靠性、易用性和社區支持。 1.MySQL提供高效的數據存儲和檢索功能，支持多種數據類型和高級查詢操作。 2.採用客戶端-服務器架構和多種存儲引擎，支持事務和查詢優化。 3.易於使用，支持多種操作系統和編程語言。 4.擁有強大的社區支持，提供豐富的資源和解決方案。

redis怎麼使用單線程 Apr 10, 2025 pm 07:12 PM

Redis 使用單線程架構，以提供高性能、簡單性和一致性。它利用 I/O 多路復用、事件循環、非阻塞 I/O 和共享內存來提高並發性，但同時存在並發性受限、單點故障和不適合寫密集型工作負載的局限性。

MySQL和SQL：開發人員的基本技能 Apr 10, 2025 am 09:30 AM

MySQL和SQL是開發者必備技能。 1.MySQL是開源的關係型數據庫管理系統，SQL是用於管理和操作數據庫的標準語言。 2.MySQL通過高效的數據存儲和檢索功能支持多種存儲引擎，SQL通過簡單語句完成複雜數據操作。 3.使用示例包括基本查詢和高級查詢，如按條件過濾和排序。 4.常見錯誤包括語法錯誤和性能問題，可通過檢查SQL語句和使用EXPLAIN命令優化。 5.性能優化技巧包括使用索引、避免全表掃描、優化JOIN操作和提升代碼可讀性。

SQL刪除行後如何恢復數據 Apr 09, 2025 pm 12:21 PM

直接從數據庫中恢復被刪除的行通常是不可能的，除非有備份或事務回滾機制。關鍵點：事務回滾：在事務未提交前執行ROLLBACK可恢復數據。備份：定期備份數據庫可用於快速恢復數據。數據庫快照：可創建數據庫只讀副本，在數據誤刪後恢復數據。慎用DELETE語句：仔細檢查條件，避免誤刪數據。使用WHERE子句：明確指定要刪除的數據。使用測試環境：在執行DELETE操作前進行測試。

MySQL的位置：數據庫和編程 Apr 13, 2025 am 12:18 AM

MySQL在數據庫和編程中的地位非常重要，它是一個開源的關係型數據庫管理系統，廣泛應用於各種應用場景。 1）MySQL提供高效的數據存儲、組織和檢索功能，支持Web、移動和企業級系統。 2）它使用客戶端-服務器架構，支持多種存儲引擎和索引優化。 3）基本用法包括創建表和插入數據，高級用法涉及多表JOIN和復雜查詢。 4）常見問題如SQL語法錯誤和性能問題可以通過EXPLAIN命令和慢查詢日誌調試。 5）性能優化方法包括合理使用索引、優化查詢和使用緩存，最佳實踐包括使用事務和PreparedStatemen

See all articles

MySQL中由load data语句引起死锁的解决案例

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題