목차
Question
server层和存储引擎层
那LIMIT是什么鬼?
怎么办?
吐个槽
데이터 베이스 MySQL 튜토리얼 MySQL의 LIMIT 문에 대한 심층 분석

MySQL의 LIMIT 문에 대한 심층 분석

Oct 13, 2021 pm 07:02 PM
mysql

이 기사에서는 MySQL의 LIMIT 문을 이해하고 질문에 대해 이야기합니다. MySQL의 LIMIT가 그렇게 나쁜가요? 모두에게 도움이 되기를 바랍니다!

MySQL의 LIMIT 문에 대한 심층 분석

최근 Q&A 그룹에서 많은 친구들이 아이들에게 LIMIT에 대해 질문했습니다.

Question

스토리가 원활하게 전개되려면 먼저 테이블이 있어야 합니다.

CREATE TABLE t (
    id INT UNSIGNED NOT NULL AUTO_INCREMENT,
    key1 VARCHAR(100),
    common_field VARCHAR(100),
    PRIMARY KEY (id),
    KEY idx_key1 (key1)
) Engine=InnoDB CHARSET=utf8;
로그인 후 복사

테이블 t에는 3개의 열이 있고, id 열은 기본 키이고, key1 열은 보조 인덱스 열입니다. 테이블에는 10,000개의 레코드가 포함되어 있습니다. [관련 권장사항: mysql 동영상 튜토리얼]

다음 명령문을 실행할 때 보조 인덱스 idx_key1을 사용합니다.

mysql>  EXPLAIN SELECT * FROM t ORDER BY key1 LIMIT 1;
+----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-------+
| id | select_type | table | partitions | type  | possible_keys | key      | key_len | ref  | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-------+
|  1 | SIMPLE      | t     | NULL       | index | NULL          | idx_key1 | 303     | NULL |    1 |   100.00 | NULL  |
+----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-------+
1 row in set, 1 warning (0.00 sec)
로그인 후 복사

보조 인덱스 idx_key1에서 key1 열이 순서대로 지정되어 있으므로 이해하기 쉽습니다. 쿼리는 key1 열로 정렬된 첫 번째 레코드를 검색하는 것입니다. 그런 다음 MySQL은 idx_key1에서 첫 번째 보조 인덱스 레코드를 얻은 다음 테이블로 직접 돌아가 전체 레코드를 얻으면 됩니다.

하지만 위 명령문의 LIMIT 1LIMIT 5000, 1로 바꾸면 전체 테이블을 스캔하고 파일 정렬을 수행해야 합니다. 실행 계획은 다음과 같습니다. : LIMIT 1换成LIMIT 5000, 1,则却需要进行全表扫描,并进行filesort,执行计划如下:

mysql>  EXPLAIN SELECT * FROM t ORDER BY key1 LIMIT 5000, 1;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------+
| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra          |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------+
|  1 | SIMPLE      | t     | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 9966 |   100.00 | Using filesort |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+----------------+
1 row in set, 1 warning (0.00 sec)
로그인 후 복사

有的同学就很不理解了:LIMIT 5000, 1也可以使用二级索引idx_key1呀,我们可以先扫描到第5001条二级索引记录,对第5001条二级索引记录进行回表操作不就好了么,这样的代价肯定比全表扫描+filesort强呀。

很遗憾的告诉各位,由于MySQL实现上的缺陷,不会出现上述的理想情况,它只会笨笨的去执行全表扫描+filesort,下边我们唠叨一下到底是咋回事儿。

server层和存储引擎层

大家都知道,MySQL内部其实是分为server层和存储引擎层的:

  • server层负责处理一些通用的事情,诸如连接管理、SQL语法解析、分析执行计划之类的东西

  • 存储引擎层负责具体的数据存储,诸如数据是存储到文件上还是内存里,具体的存储格式是什么样的之类的。我们现在基本都使用InnoDB存储引擎,其他存储引擎使用的非常少了,所以我们也就不涉及其他存储引擎了。

MySQL中一条SQL语句的执行是通过server层和存储引擎层的多次交互才能得到最终结果的。比方说下边这个查询:

SELECT * FROM t WHERE key1 > &#39;a&#39; AND key1 < &#39;b&#39; AND common_field != &#39;a&#39;;
로그인 후 복사

server层会分析到上述语句可以使用下边两种方案执行:

  • 方案一:使用全表扫描

  • 方案二:使用二级索引idx_key1,此时需要扫描key1列值在('a', 'b')之间的全部二级索引记录,并且每条二级索引记录都需要进行回表操作。

server层会分析上述两个方案哪个成本更低,然后选取成本更低的那个方案作为执行计划。然后就调用存储引擎提供的接口来真正的执行查询了。

这里假设采用方案二,也就是使用二级索引idx_key1执行上述查询。那么server层和存储引擎层的对话可以如下所示:

MySQL의 LIMIT 문에 대한 심층 분석

server层:“hey,麻烦去查查idx_key1二级索引的('a', 'b')区间的第一条记录,然后把回表后把完整的记录返给我哈”

InnoDB:“收到,这就去查”,然后InnoDB就通过idx_key1二级索引对应的B+树,快速定位到扫描区间('a', 'b')的第一条二级索引记录,然后进行回表,得到完整的聚簇索引记录返回给server层。

MySQL의 LIMIT 문에 대한 심층 분석

server层收到完整的聚簇索引记录后,继续判断common_field!=&#39;a&#39;

SELECT * FROM t ORDER BY key1 LIMIT 5000, 1;
로그인 후 복사
로그인 후 복사

일부 학생들은 이해하지 못합니다: LIMIT 5000, 1 보조 인덱스 idx_key1을 사용할 수도 있습니다. 먼저 5001번째 보조 인덱스 레코드를 스캔한 다음 5001번째 보조 인덱스 레코드를 스캔할 수 있습니다. 테이블을 기록하고 테이블로 되돌려 놓는 것이 좋지 않을까요? 이 비용은 확실히 전체 테이블 스캔 + 파일 정렬보다 낫습니다.

MySQL 구현의 결함으로 인해 위의 이상적인 상황은 발생하지 않는다는 점을 말씀드리게 되어 유감입니다. 전체 테이블 스캔 + 파일 정렬만 어리석게 수행하게 됩니다.


서버 계층 및 스토리지 엔진 계층

우리 모두 알고 있듯이 MySQL은 실제로 서버 계층과 스토리지 엔진 계층으로 구분됩니다.

  • 🎜서버 스토리지 엔진 계층은 연결 관리, SQL 구문 분석, 실행 계획 분석과 같은 몇 가지 일반적인 작업을 처리합니다. 여기서는 데이터가 파일에 저장되는지 아니면 메모리에 저장되는지와 같은 특정 데이터 저장을 담당합니다. , 구체적인 저장 형식은 무엇입니까? 현재는 기본적으로 InnoDB 스토리지 엔진을 사용하고 있으며, 다른 스토리지 엔진은 거의 사용되지 않으므로 다른 스토리지 엔진은 다루지 않겠습니다. 🎜
🎜MySQL에서 SQL 문을 실행하려면 최종 결과를 얻기 위해 서버 계층과 스토리지 엔진 계층 간의 여러 상호 작용이 필요합니다. 예를 들어 아래 쿼리는 다음과 같습니다. 🎜
SELECT * FROM t, (SELECT id FROM t ORDER BY key1 LIMIT 5000, 1) AS d
    WHERE t.id = d.id;
로그인 후 복사
로그인 후 복사
🎜서버 계층은 위 명령문이 다음 두 가지 옵션을 사용하여 실행될 수 있는지 분석합니다. 🎜
  • 🎜옵션 1: 전체 테이블 스캔 사용🎜
  • 🎜옵션 2 : 보조 인덱스 idx_key1을 사용합니다. 이때 ('a', 'b') 사이의 key1 컬럼 값이 있는 모든 보조 인덱스 레코드를 스캔해야 하며, 각 보조 인덱스 레코드는 테이블. 🎜
🎜서버 계층은 위의 두 가지 옵션 중 어느 것이 더 낮은 비용인지 분석한 다음 더 낮은 비용의 옵션을 실행 계획으로 선택합니다. 그런 다음 스토리지 엔진에서 제공하는 인터페이스를 호출하여 실제로 쿼리를 실행합니다. 🎜🎜옵션 2가 채택되었다고 가정합니다. 즉, 위 쿼리를 실행하는 데 보조 인덱스 idx_key1이 사용됩니다. 그러면 서버 계층과 스토리지 엔진 계층 간의 대화는 다음과 같을 수 있습니다. 🎜🎜MySQL의 LIMIT 문에 대한 심층 분석🎜🎜서버 레이어: "야, idx_key1 2차 인덱스의 ('a', 'b') 간격의 첫 번째 레코드를 확인한 후 반환해 주세요. 전체 레코드를 나에게 반환하세요."🎜🎜InnoDB: "수신됨, 지금 확인하세요" 그러면 InnoDB는 idx_key1 보조 인덱스에 해당하는 B+ 트리를 통해 스캔 간격('a', 'b')을 빠르게 찾습니다. 그런 다음 보조 인덱스 레코드가 테이블로 반환되고 전체 클러스터형 인덱스 레코드가 서버 계층으로 반환됩니다. 🎜🎜MySQL의 LIMIT 문에 대한 심층 분석🎜🎜서버 레이어는 전체 클러스터형 인덱스 레코드를 수신한 후 계속해서 common_field!='a' 조건이 true인지 확인합니다. true가 아닌 경우 해당 레코드는 삭제됩니다. 클라이언트. 그런 다음 스토리지 엔진에 "다음 레코드를 주세요"라고 말합니다.🎜🎜🎜팁:🎜🎜여기에서 레코드를 클라이언트에 보내는 것은 실제로 이를 로컬 네트워크 버퍼로 보내는 것입니다. 기본값은 net_buffer_length에 의해 제어됩니다. 16KB 크기. 실제로 네트워크 패킷을 클라이언트에 보내기 전에 버퍼가 가득 찰 때까지 기다리십시오. 🎜🎜🎜InnoDB: "접수되었습니다. 지금 확인하세요." InnoDB는 레코드의 next_record 속성을 기반으로 idx_key1의 ('a', 'b') 간격에서 다음 보조 인덱스 레코드를 찾은 후 테이블 반환 작업을 수행하고 완전한 클러스터형 인덱스 레코드를 서버 계층에 반환합니다. 🎜

小贴士:

不论是聚簇索引记录还是二级索引记录,都包含一个称作next_record的属性,各个记录根据next_record连成了一个链表,并且链表中的记录是按照键值排序的(对于聚簇索引来说,键值指的是主键的值,对于二级索引记录来说,键值指的是二级索引列的值)。

MySQL의 LIMIT 문에 대한 심층 분석

server层收到完整的聚簇索引记录后,继续判断common_field!=&#39;a&#39;条件是否成立,如果不成立则舍弃该记录,否则将该记录发送到客户端。然后对存储引擎说:“请把下一条记录给我哈”

... 然后就不停的重复上述过程。

直到:

MySQL의 LIMIT 문에 대한 심층 분석

也就是直到InnoDB发现根据二级索引记录的next_record获取到的下一条二级索引记录不在('a', 'b')区间中,就跟server层说:“好了,('a', 'b')区间没有下一条记录了”

server层收到InnoDB说的没有下一条记录的消息,就结束查询。

现在大家就知道了server层和存储引擎层的基本交互过程了。

那LIMIT是什么鬼?

说出来大家可能有点儿惊讶,MySQL是在server层准备向客户端发送记录的时候才会去处理LIMIT子句中的内容。拿下边这个语句举例子:

SELECT * FROM t ORDER BY key1 LIMIT 5000, 1;
로그인 후 복사
로그인 후 복사

如果使用idx_key1执行上述查询,那么MySQL会这样处理:

  • server层向InnoDB要第1条记录,InnoDB从idx_key1中获取到第一条二级索引记录,然后进行回表操作得到完整的聚簇索引记录,然后返回给server层。server层准备将其发送给客户端,此时发现还有个LIMIT 5000, 1的要求,意味着符合条件的记录中的第5001条才可以真正发送给客户端,所以在这里先做个统计,我们假设server层维护了一个称作limit_count的变量用于统计已经跳过了多少条记录,此时就应该将limit_count设置为1。

  • server层再向InnoDB要下一条记录,InnoDB再根据二级索引记录的next_record属性找到下一条二级索引记录,再次进行回表得到完整的聚簇索引记录返回给server层。server层在将其发送给客户端的时候发现limit_count才是1,所以就放弃发送到客户端的操作,将limit_count加1,此时limit_count变为了2。

  • ... 重复上述操作

  • 直到limit_count等于5000的时候,server层才会真正的将InnoDB返回的完整聚簇索引记录发送给客户端。

从上述过程中我们可以看到,由于MySQL中是在实际向客户端发送记录前才会去判断LIMIT子句是否符合要求,所以如果使用二级索引执行上述查询的话,意味着要进行5001次回表操作。server层在进行执行计划分析的时候会觉得执行这么多次回表的成本太大了,还不如直接全表扫描+filesort快呢,所以就选择了后者执行查询。

怎么办?

由于MySQL实现LIMIT子句的局限性,在处理诸如LIMIT 5000, 1这样的语句时就无法通过使用二级索引来加快查询速度了么?其实也不是,只要把上述语句改写成:

SELECT * FROM t, (SELECT id FROM t ORDER BY key1 LIMIT 5000, 1) AS d
    WHERE t.id = d.id;
로그인 후 복사
로그인 후 복사

这样,SELECT id FROM t ORDER BY key1 LIMIT 5000, 1作为一个子查询单独存在,由于该子查询的查询列表只有一个id列,MySQL可以通过仅扫描二级索引idx_key1执行该子查询,然后再根据子查询中获得到的主键值去表t中进行查找。

这样就省去了前5000条记录的回表操作,从而大大提升了查询效率!

吐个槽

设计MySQL的大叔啥时候能改改LIMIT子句的这种超笨的实现呢?还得用户手动想欺骗优化器的方案才能提升查询效率~

更多编程相关知识,请访问:编程视频!!

위 내용은 MySQL의 LIMIT 문에 대한 심층 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

phpmyadmin을 여는 방법 phpmyadmin을 여는 방법 Apr 10, 2025 pm 10:51 PM

다음 단계를 통해 phpmyadmin을 열 수 있습니다. 1. 웹 사이트 제어판에 로그인; 2. phpmyadmin 아이콘을 찾고 클릭하십시오. 3. MySQL 자격 증명을 입력하십시오. 4. "로그인"을 클릭하십시오.

MySQL : 세계에서 가장 인기있는 데이터베이스 소개 MySQL : 세계에서 가장 인기있는 데이터베이스 소개 Apr 12, 2025 am 12:18 AM

MySQL은 오픈 소스 관계형 데이터베이스 관리 시스템으로, 주로 데이터를 신속하고 안정적으로 저장하고 검색하는 데 사용됩니다. 작업 원칙에는 클라이언트 요청, 쿼리 해상도, 쿼리 실행 및 반환 결과가 포함됩니다. 사용의 예로는 테이블 작성, 데이터 삽입 및 쿼리 및 조인 작업과 같은 고급 기능이 포함됩니다. 일반적인 오류에는 SQL 구문, 데이터 유형 및 권한이 포함되며 최적화 제안에는 인덱스 사용, 최적화 된 쿼리 및 테이블 분할이 포함됩니다.

단일 스레드 레 디스를 사용하는 방법 단일 스레드 레 디스를 사용하는 방법 Apr 10, 2025 pm 07:12 PM

Redis는 단일 스레드 아키텍처를 사용하여 고성능, 단순성 및 일관성을 제공합니다. 동시성을 향상시키기 위해 I/O 멀티플렉싱, 이벤트 루프, 비 블로킹 I/O 및 공유 메모리를 사용하지만 동시성 제한 제한, 단일 고장 지점 및 쓰기 집약적 인 워크로드에 부적합한 제한이 있습니다.

MySQL의 장소 : 데이터베이스 및 프로그래밍 MySQL의 장소 : 데이터베이스 및 프로그래밍 Apr 13, 2025 am 12:18 AM

데이터베이스 및 프로그래밍에서 MySQL의 위치는 매우 중요합니다. 다양한 응용 프로그램 시나리오에서 널리 사용되는 오픈 소스 관계형 데이터베이스 관리 시스템입니다. 1) MySQL은 웹, 모바일 및 엔터프라이즈 레벨 시스템을 지원하는 효율적인 데이터 저장, 조직 및 검색 기능을 제공합니다. 2) 클라이언트 서버 아키텍처를 사용하고 여러 스토리지 엔진 및 인덱스 최적화를 지원합니다. 3) 기본 사용에는 테이블 작성 및 데이터 삽입이 포함되며 고급 사용에는 다중 테이블 조인 및 복잡한 쿼리가 포함됩니다. 4) SQL 구문 오류 및 성능 문제와 같은 자주 묻는 질문은 설명 명령 및 느린 쿼리 로그를 통해 디버깅 할 수 있습니다. 5) 성능 최적화 방법에는 인덱스의 합리적인 사용, 최적화 된 쿼리 및 캐시 사용이 포함됩니다. 모범 사례에는 거래 사용 및 준비된 체계가 포함됩니다

MySQL을 사용하는 이유는 무엇입니까? 혜택과 장점 MySQL을 사용하는 이유는 무엇입니까? 혜택과 장점 Apr 12, 2025 am 12:17 AM

MySQL은 성능, 신뢰성, 사용 편의성 및 커뮤니티 지원을 위해 선택됩니다. 1.MYSQL은 효율적인 데이터 저장 및 검색 기능을 제공하여 여러 데이터 유형 및 고급 쿼리 작업을 지원합니다. 2. 고객-서버 아키텍처 및 다중 스토리지 엔진을 채택하여 트랜잭션 및 쿼리 최적화를 지원합니다. 3. 사용하기 쉽고 다양한 운영 체제 및 프로그래밍 언어를 지원합니다. 4. 강력한 지역 사회 지원을 받고 풍부한 자원과 솔루션을 제공합니다.

Apache의 데이터베이스에 연결하는 방법 Apache의 데이터베이스에 연결하는 방법 Apr 13, 2025 pm 01:03 PM

Apache는 데이터베이스에 연결하여 다음 단계가 필요합니다. 데이터베이스 드라이버 설치. 연결 풀을 만들려면 Web.xml 파일을 구성하십시오. JDBC 데이터 소스를 작성하고 연결 설정을 지정하십시오. JDBC API를 사용하여 Connections, 명세서 작성, 매개 변수 바인딩, 쿼리 또는 업데이트 실행 및 처리를 포함하여 Java 코드의 데이터베이스에 액세스하십시오.

Redis Exporter 서비스로 Redis 액 적을 모니터링하십시오 Redis Exporter 서비스로 Redis 액 적을 모니터링하십시오 Apr 10, 2025 pm 01:36 PM

Redis 데이터베이스의 효과적인 모니터링은 최적의 성능을 유지하고 잠재적 인 병목 현상을 식별하며 전반적인 시스템 신뢰성을 보장하는 데 중요합니다. Redis Exporter Service는 Prometheus를 사용하여 Redis 데이터베이스를 모니터링하도록 설계된 강력한 유틸리티입니다. 이 튜토리얼은 Redis Exporter Service의 전체 설정 및 구성을 안내하여 모니터링 솔루션을 원활하게 구축 할 수 있도록합니다. 이 자습서를 연구하면 완전히 작동하는 모니터링 설정을 달성 할 수 있습니다.

Docker의 MySQL을 시작하는 방법 Docker의 MySQL을 시작하는 방법 Apr 15, 2025 pm 12:09 PM

Docker에서 MySQL을 시작하는 프로세스는 다음 단계로 구성됩니다. MySQL 이미지를 가져와 컨테이너를 작성하고 시작하고 루트 사용자 암호를 설정하고 포트 확인 연결을 매핑하고 데이터베이스를 작성하고 사용자는 데이터베이스에 모든 권한을 부여합니다.

See all articles