MySQL中由load data语句引起死锁的解决案例

집

데이터 베이스

MySQL 튜토리얼

MySQL中由load data语句引起死锁的解决案例_MySQL

PHP中文网

May 27, 2016 pm 01:45 PM

一个线上项目报的死锁，简要说明一下产生原因、处理方案和相关的一些点.

1、背景

这是一个类似数据分析的项目，数据完全通过LOAD DATA语句导入一个InnoDB表中。为方便描述，表结构简化为如下：

Create table tb(id int primary key auto_increment, c int not null) engine=innodb;

로그인 후 복사

导入数据的语句对应为

Load data infile &lsquo;data1.csv&#39; into table tb;

Load data infile &lsquo;data2.csv&#39; into table tb;

로그인 후 복사

cat Data1.csv

1 100

2 100

3 100


Cat data2.csv

10 100

11 100

12 100

로그인 후 복사

产生死锁的证据是在show engine innodb status的LATEST DETECTED DEADLOCK段中看到死锁信息，简化为如下：

2016122171536039.png (578×246)

说明

从上面表格中看出，事务1在等待某一行的锁。而事务2持有这行的锁，但等待表的自增锁（AUTO_INC），判断为死锁，事务回滚。
这里事务1没有写出来，但是可以推断，事务1持有这个表的自增锁（否则就不是死锁了）。

2、背景知识1：AUTO_INC lock 及其选项

在InnoDB表中，若存在自增字段，则会维护一个表级别的锁，这里称为自增锁。每次插入新数据，或者update语句修改了此字段，都会需要获取这个锁

由于一个事务可能包含多个语句，而并非所有的语句都与自增字段有关，因此InnoDB作了一个特殊的处理，自增锁在一个语句结束后马上被释放。之所以说是特殊处理，是因为普通的锁，都是在事务结束后释放。

若一个表有自增字段，一个insert语句不指定该字段的值，或指定为NULL时，InnoDB会给它赋值为当前的AUTO_INCREMENT的值，然后AUTO_INCREMENT加1。

与这个自增锁相关的一个参数是innodb_autoinc_lock_mode. 默认值为1，可选为0,1,2。

我们先来看当这个值设置为0时，一个有自增字段的表，插入一行数据时的行为：

1) 申请AUTO_INC锁

2) 得到当前AUTO_INCREMNT值n，给AUTO_INCREMENT 加1

3) 执行插入操作，并将n填入新增的行对应字段中

4) 释放AUTO_INC锁

我们看到这个过程中，虽然InnoDB为了减少锁粒度，在语句执行完成就马上释放，但这锁还是太大了――它包括了插入操作的时间。这就导致了两个insert语句，实际上没办法并行。

没有这个参数之前，行为就是与设置为0相同，0这个选项就是留着兼容的。

很容易想到设置为1的时候，应该是将3) 和 4)对调。但是本文还是要讨论为0的情况，因为我们的前提是LOAD语句，而LOAD语句这类插入多行的语句中（包括insert …select …），即使设置为1也没用，会退化为0的模式。

3、背景知识2：LOAD DATA语句的主从行为

为什么插入多行的语句要即使将innodb_autoinc_lock_mode设置为1，也会用0的模式呢？

主要原因还是为了主从一致性。设想binlog_format='statement'，一个LOAD DATA语句在主库的binlog直接记录为语句本身，那从库如何重放：

1) 将load data用到的文件发给slave，slave将文件保存在临时目录。

2) 在slave也执行一次LOAD DATA语句。

其间有一个问题：slave怎么保证load data语句的自增id字段与master相同？

为了解决这个问题，主库的binlog中还有一个set SET INSERT_ID命令，表明这个LOAD DATA语句插入的第一行的自增ID值。这样slave在执行load data之前，先执行了这个set SET INSERT_ID语句，用于保证执行结果与主库一模一样。

上述的机制能保证主从数据一致的前提是：主从库上LOAD DATA语句生成的自增ID值必须是连续的。

4、背景知识1＋2：分析

回到前面说的模式0和1的区别，我们看到，如果AUTO_INC锁在整个语句开始之前就获取，在语句结束之后才释放，这样就能保证整个语句生成的id连续――模式0的保证。

对于1，每次拿到下一个值就释放，插入数据后，若需要再申请，则不连续。

这就是为什么，即使设置为1，对于多行操作，会退化成0。

至此我们知道这个死锁出现的原因，是这两个LOAD DATA语句不仅会访问相同的记录，还会访问同一个AUTO_INC锁，造成互相等待。

到此没完，因为我们知道虽然两个线程访问两个锁可能造成死锁，但是死锁还有另外一个条件，与申请顺序有关。既然AUTO_INC是一个表锁，不论谁先拿到，会阻塞其他同表的LOAD DATA的执行，又为什么会在某个记录上出现锁等待？

5、背景知识3：AUTO_INC的加锁时机

前面我们说到每次涉及到插入新数据，就会要求对AUTO_INC加锁，并列出了流程。但这个流程是对于需要从InnoDB中得到自增值来设置列值的情况。另一种情况是在语句中已经指定了该列的值。

比如对于这个表，执行 insert into tb values(9,100). 此时id的值已经明确是9，虽然不需要取值来填，但是插入这行后有可能需要改变AUTO_INCREMENT的值（若原来是<10,则应该改为10），所以这个锁还是省不了。流程变成：

1）插入数据

2）若失败则流程结束

3）若成功，申请AUTO_INC锁

4）调用set_max….函数，如有必要则修改AUTO_INCREMENT

5）语句结束时释放AUTO_INC锁。

6、为什么修改AUTO_INC顺序

这么调整的好处是什么？主要是为了减少不必要的锁访问。若在插入数据期间发生错误，比如其他字段造成DUPLICATE KEY error，这样就不用访问AUTO_INC锁。

7、死锁过程复现

必须强调是“语句结束时”。这样我们来看一个每行都已经指定了自增列值的LOAD DATA语句的流程（也就是本文例子的情况）：

1) 插入第一条数据

2) 申请AUTO_INC锁

3) 插入第二条

4) 申请AUTO_INC 锁（因为已经是自己的，直接成功）

5) 。。。。。。插入剩余所有行

6) 释放AUTO_INC锁。

所以这个流程就简单描述为：插入第一行，申请AUTO_INC锁，然后插入剩下的所有行后再释放。

我们前面提到过，插入第一条数据时可能需要访问的记录锁，是要等到整个事务结束后才释放的.

有了上面的这些背景知识，我们来复现一下死锁出现的过程

2016122171638180.png (580×207)

可以看到触发条件还是比较苛刻的，尤其是session2要刚好要用到session1锁住的那个记录锁。需要说明，由于InnoDB内部对记录的表示，同一个记录锁并不表示主键值一定相同。

8、解决方案1：去掉不必要的AUTO_INCREMENT字段

在这个业务中，由于所有的数据都是通过LOAD DATA进去，而且都已经指定了自增字段的值，因此这个AUTO)INCREMENT属性是不需要的。

少了一个，就死锁不了了。

9、解决方案2：强制模式1

前面我们说到innodb_autoinc_lock_mode这个参数的可选值有0、1、2。当设置为1的时候，在LOAD DATA语句会退化为模式0。但若设置为2，则无论如何都会使用模式1。

我们前面说到使用模式1会导致LOAD DATA生成的自增id值不连续，这样会导致在binlog_format是1时主从不一致，因此设置为2的前提，是binlog_format 是row.

在binlog_format='row'时，设置innodb_autoinc_lock_mode为2是安全的。

若允许，方案2比方案1更轻量些，不需要修改数据和表结构。

以上就是MySQL中由load data语句引起死锁的解决案例_MySQL的内容，更多相关内容请关注PHP中文网（www.php.cn）！

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7442

Cakephp 튜토리얼

1371

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

MySQL에 루트로 로그인 할 수 없습니다 Apr 08, 2025 pm 04:54 PM

Root로 MySQL에 로그인 할 수없는 주된 이유는 권한 문제, 구성 파일 오류, 암호 일관성이 없음, 소켓 파일 문제 또는 방화벽 차단입니다. 솔루션에는 다음이 포함됩니다. 구성 파일의 BAND-ADDRESS 매개 변수가 올바르게 구성되어 있는지 확인하십시오. 루트 사용자 권한이 수정 또는 삭제되어 재설정되었는지 확인하십시오. 케이스 및 특수 문자를 포함하여 비밀번호가 정확한지 확인하십시오. 소켓 파일 권한 설정 및 경로를 확인하십시오. 방화벽이 MySQL 서버에 연결되는지 확인하십시오.

MySQL 테이블 잠금 테이블 변경 여부 Apr 08, 2025 pm 05:06 PM

MySQL이 테이블 구조를 수정하면 메타 데이터 잠금 장치가 일반적으로 사용되므로 테이블을 잠글 수 있습니다. 자물쇠의 영향을 줄이려면 다음과 같은 조치를 취할 수 있습니다. 1. 온라인 DDL과 함께 테이블을 사용할 수 있습니다. 2. 배치에서 복잡한 수정을 수행합니다. 3. 소형 또는 피크 기간 동안 운영됩니다. 4. PT-OSC 도구를 사용하여 더 미세한 제어를 달성하십시오.

Redshift Zero ETL과의 RDS MySQL 통합 Apr 08, 2025 pm 07:06 PM

데이터 통합 단순화 : AmazonRdsMysQL 및 Redshift의 Zero ETL 통합 효율적인 데이터 통합은 데이터 중심 구성의 핵심입니다. 전통적인 ETL (추출, 변환,로드) 프로세스는 특히 데이터베이스 (예 : AmazonRDSMySQL)를 데이터웨어 하우스 (예 : Redshift)와 통합 할 때 복잡하고 시간이 많이 걸립니다. 그러나 AWS는 이러한 상황을 완전히 변경 한 Zero ETL 통합 솔루션을 제공하여 RDSMYSQL에서 Redshift로 데이터 마이그레이션을위한 단순화 된 거의 실시간 솔루션을 제공합니다. 이 기사는 RDSMYSQL ZERL ETL 통합으로 Redshift와 함께 작동하여 데이터 엔지니어 및 개발자에게 제공하는 장점과 장점을 설명합니다.

MySQL의 쿼리 최적화는 데이터베이스 성능을 향상시키는 데 필수적입니다. 특히 대규모 데이터 세트를 처리 할 때 Apr 08, 2025 pm 07:12 PM

1. 올바른 색인을 사용하여 스캔 한 데이터의 양을 줄임으로써 데이터 검색 속도를 높이십시오. 테이블 열을 여러 번 찾으면 해당 열에 대한 인덱스를 만듭니다. 귀하 또는 귀하의 앱이 기준에 따라 여러 열에서 데이터가 필요한 경우 복합 인덱스 2를 만듭니다. 2. 선택을 피하십시오 * 필요한 열만 선택하면 모든 원치 않는 열을 선택하면 더 많은 서버 메모리를 선택하면 서버가 높은 부하 또는 주파수 시간으로 서버가 속도가 느려지며, 예를 들어 Creation_at 및 Updated_at 및 Timestamps와 같은 열이 포함되어 있지 않기 때문에 쿼리가 필요하지 않기 때문에 테이블은 선택을 피할 수 없습니다.

MySQL 사용자와 데이터베이스의 관계 Apr 08, 2025 pm 07:15 PM

MySQL 데이터베이스에서 사용자와 데이터베이스 간의 관계는 권한과 테이블로 정의됩니다. 사용자는 데이터베이스에 액세스 할 수있는 사용자 이름과 비밀번호가 있습니다. 권한은 보조금 명령을 통해 부여되며 테이블은 Create Table 명령에 의해 생성됩니다. 사용자와 데이터베이스 간의 관계를 설정하려면 데이터베이스를 작성하고 사용자를 생성 한 다음 권한을 부여해야합니다.

MySQL은 지불해야합니다 Apr 08, 2025 pm 05:36 PM

MySQL에는 무료 커뮤니티 버전과 유료 엔터프라이즈 버전이 있습니다. 커뮤니티 버전은 무료로 사용 및 수정할 수 있지만 지원은 제한되어 있으며 안정성이 낮은 응용 프로그램에 적합하며 기술 기능이 강합니다. Enterprise Edition은 안정적이고 신뢰할 수있는 고성능 데이터베이스가 필요하고 지원 비용을 기꺼이 지불하는 응용 프로그램에 대한 포괄적 인 상업적 지원을 제공합니다. 버전을 선택할 때 고려 된 요소에는 응용 프로그램 중요도, 예산 책정 및 기술 기술이 포함됩니다. 완벽한 옵션은없고 가장 적합한 옵션 만 있으므로 특정 상황에 따라 신중하게 선택해야합니다.

MySQL은 Android에서 실행할 수 있습니다 Apr 08, 2025 pm 05:03 PM

MySQL은 Android에서 직접 실행할 수는 없지만 다음 방법을 사용하여 간접적으로 구현할 수 있습니다. Android 시스템에 구축 된 Lightweight Database SQLite를 사용하여 별도의 서버가 필요하지 않으며 모바일 장치 애플리케이션에 매우 적합한 작은 리소스 사용량이 있습니다. MySQL 서버에 원격으로 연결하고 데이터 읽기 및 쓰기를 위해 네트워크를 통해 원격 서버의 MySQL 데이터베이스에 연결하지만 강력한 네트워크 종속성, 보안 문제 및 서버 비용과 같은 단점이 있습니다.

고로드 애플리케이션의 MySQL 성능을 최적화하는 방법은 무엇입니까? Apr 08, 2025 pm 06:03 PM

MySQL 데이터베이스 성능 최적화 안내서 리소스 집약적 응용 프로그램에서 MySQL 데이터베이스는 중요한 역할을 수행하며 대규모 트랜잭션 관리를 담당합니다. 그러나 응용 프로그램 규모가 확장됨에 따라 데이터베이스 성능 병목 현상은 종종 제약이됩니다. 이 기사는 일련의 효과적인 MySQL 성능 최적화 전략을 탐색하여 응용 프로그램이 고 부하에서 효율적이고 반응이 유지되도록합니다. 실제 사례를 결합하여 인덱싱, 쿼리 최적화, 데이터베이스 설계 및 캐싱과 같은 심층적 인 주요 기술을 설명합니다. 1. 데이터베이스 아키텍처 설계 및 최적화 된 데이터베이스 아키텍처는 MySQL 성능 최적화의 초석입니다. 몇 가지 핵심 원칙은 다음과 같습니다. 올바른 데이터 유형을 선택하고 요구 사항을 충족하는 가장 작은 데이터 유형을 선택하면 저장 공간을 절약 할 수있을뿐만 아니라 데이터 처리 속도를 향상시킬 수 있습니다.

See all articles

MySQL中由load data语句引起死锁的解决案例_MySQL

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제