> 데이터 베이스 > MySQL 튜토리얼 > MySQL 최적화 프로그램의 해시 조인 사용 방해

MySQL 최적화 프로그램의 해시 조인 사용 방해

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
풀어 주다: 2022-09-15 19:47:27
앞으로
2304명이 탐색했습니다.

추천 학습: mysql 비디오 튜토리얼

GreatSQL 커뮤니티 원본 콘텐츠는 승인 없이 사용할 수 없으며 재인쇄할 경우 편집자에게 문의하시기 바랍니다. GreatSQL은 MySQL의 국내 브랜치 버전으로, 사용법은 MySQL과 동일합니다.

머리말

데이터베이스 최적화 프로그램은 대부분의 경우 올바른 결정을 내리고, 올바른 실행 계획을 세우고, 효율적인 경로를 찾을 수 있지만, 결국 일정한 규칙과 알고리즘을 기반으로 합니다. .때때로 옵티마이저가 내리는 판단은 인간의 두뇌만큼 유연하지 않습니다.옵티마이저가 잘못된 실행 계획을 선택했다고 판단하면 우리는 어떻게 해야 할까요? 어떤 길을 선택할지.

우리는 Oracle이 Nest 사용 여부를 제어하기 위해 use_nl, no_use_nl과 같이 여러 테이블을 연결할 때 어떤 테이블 연결 방법을 선택할지 최적화 프로그램에 지시하는 보다 유연한 힌트를 제공한다는 것을 알고 있습니다. 루프 조인, use_hash, no_use_hash는 해시 조인 사용 여부를 제어합니다. use_nlno_use_nl控制是否使用Nest Loop Join,use_hash,no_use_hash控制是否使用hash join。

但是MySQL长期以来只有一种表连接方式,那就是Nest Loop Join,直到MySQL8.0.18版本才出现了hash join, 所以MySQL在控制表连接方式上没有提供那么多丰富的hint给我们使用,hash_joinno_hash_join的hint只是惊鸿一瞥,只在8.0.18版本存在,8.0.19及后面的版本又将这个hint给废弃了,那如果我们想让两个表做hash join该怎么办呢?

实验

我们来以MySQL8.0.25的单机环境做一个实验。建两个表,分别插入10000行数据,使用主键做这两个表的关联查询。

create table t1(id int primary key,c1 int,c2 int);
create table t2(id int primary key,c1 int,c2 int);
delimiter //
CREATE PROCEDURE p_test()
BEGIN
declare i int;
set i=1;
while i<10001 do
insert into t1 values(i,i,i);
insert into t2 values(i,i,i);
SET i = i + 1;
end while;
END;
//
delimiter ;
로그인 후 복사

查询一下两表使用主键字段关联查询时实际的执行计划,如下图所示:

查询一下两表使用非索引字段关联查询时实际的执行计划,如下图所示:

从执行计划可以看出,被驱动表的关联字段上有索引,优化器在选择表连接方式时会倾向于选择Nest Loop Join,当没有可用索引时倾向于选择hash join。

基于这一点那我们可以使用no_index提示来禁止语句使用关联字段的索引。

从上面的执行计划可以看出使用no_index提示后,优化器选择了使用hash join。

当索引的选择性不好时,优化器选择使用索引做Nest Loop Join是效率是很低的。

我们将实验的两个表中c1列的数据做一下更改,使其选择性变差,并在c1列上建普通索引。

update t1 set c1=1 where id<5000;
update t2 set c1=1 where id<5000;
create index idx_t1 on t1(c1);
create index idx_t2 on t2(c1);
로그인 후 복사

当我们执行sql :

select t1.*,t2.* from t1 join t2 on t1.c1=t2.c1;
로그인 후 복사

这个查询结果会返回大量数据,被驱动表的关联字段c1列的索引选择性差,此时选择hash join是更明智的选择,但是优化器会选择走Nest Loop Join。我们可以通过实验验证一下hash join 与 Nest Loop Join的性能差异。

可以看出使用hash join的耗时是使用Nest Loop Join的1/6,但是优化器根据成本估算时,使用Nest Loop Join的成本要比使用hash join的成本低很多,所以会去选择Nest Loop Join,这个时候就需要加上hint 提示禁止使用关联字段的索引,被驱动表上每次都全表扫描的代价是很高的,这样优化器估算后就会选择走hash join。

MySQL官方文档里提到用BNLNO_BNL

하지만 MySQL에는 오랫동안 하나의 테이블 연결 방법, 즉 Nest Loop Join만 있었습니다. MySQL 버전 8.0.18까지는 해시 조인이 나타나지 않았기 때문에 MySQL은 그다지 풍부한 기능을 제공하지 않습니다. 제어 테이블 연결 방법에서 hash_joinno_hash_join은 8.0.18 버전에만 존재합니다. 힌트가 주어졌습니다. 두 테이블 간에 해시 조인을 수행하려면 어떻게 해야 합니까?

실험🎜🎜MySQL8.0.25의 독립형 환경에서 실험을 해보겠습니다. 두 개의 테이블을 만들고 각각 10,000개의 데이터 행을 삽입하고 기본 키를 사용하여 두 테이블 간의 관련 쿼리를 수행합니다. 🎜rrreee🎜아래 그림과 같이 두 테이블이 기본 키 필드를 사용하여 쿼리를 연결할 때 실제 실행 계획을 쿼리합니다. 🎜

🎜🎜그림과 같이 두 테이블이 인덱스가 아닌 필드를 사용하여 쿼리를 연결할 때 실제 실행 계획을 쿼리합니다. 아래 그림에서:🎜

🎜🎜Execute from 계획을 보면 구동 테이블의 관련 필드에 인덱스가 있는 것을 볼 수 있습니다. 옵티마이저는 테이블 연결 방법을 선택할 때 Nest Loop Join을 선택하는 경향이 있습니다. 사용 가능한 테이블이 없는 경우 인덱스를 사용하면 해시 조인을 선택하는 경향이 있습니다. 🎜🎜이를 바탕으로 no_index 프롬프트를 사용하여 명령문이 관련 필드의 인덱스를 사용하지 못하도록 금지할 수 있습니다. 🎜

🎜🎜위의 실행 계획에서 no_index 프롬프트를 사용한 후 최적화 프로그램이 해시 조인을 사용하기로 선택한 것을 볼 수 있습니다. 🎜🎜인덱스의 선택성이 좋지 않을 때 옵티마이저는 인덱스를 사용하여 Nest Loop Join을 수행하는데 이는 매우 비효율적입니다. 🎜🎜실험에서 두 테이블의 c1열 데이터를 변경하여 선택성을 낮추고 c1열에 일반 인덱스를 구축하겠습니다. 🎜rrreee🎜sql을 실행할 때: 🎜rrreee🎜이 쿼리 결과는 많은 양의 데이터를 반환합니다. 이때 구동 테이블의 관련 필드에 대한 c1 열의 인덱스 선택성은 좋지 않습니다. 선택하지만 최적화 프로그램은 Nest Loop Join을 선택합니다. Hash Join과 Nest Loop Join의 성능 차이를 실험을 통해 확인할 수 있습니다. 🎜

🎜🎜해시 조인을 사용하는 데 소요되는 시간은 Nest Loop Join을 사용하는 경우의 1/6임을 알 수 있지만, 옵티마이저가 비용을 기준으로 추정하면 Nest Loop Join을 사용하는 비용이 해시를 사용하는 비용보다 훨씬 저렴합니다. Join을 선택하므로 이때 관련 필드의 인덱스 사용을 금지하는 힌트를 추가해야 합니다. 구동 테이블에서 매번 전체 테이블을 스캔하는 비용이 매우 높기 때문입니다. 최적화 프로그램은 추정 후 해시 조인을 선택합니다. 🎜🎜MySQL 공식 문서에서는 해시 조인 최적화에 영향을 주기 위해 BNLNO_BNL 힌트를 사용한다고 언급하고 있습니다. 그러나 실험 결과 관련 필드에 사용 가능한 인덱스가 없는 것으로 나타났습니다. 옵티마이저는 비용을 추정할 때 구동 테이블의 중첩 루프 조인에 대해 BNL 전체 테이블 스캔을 사용하지 않고 해시 조인을 사용하도록 선택하므로 이 시나리오에서는 NO_BNL이 쓸모가 없습니다. 🎜🎜그럼 이 인덱스는 사용하지 않으니 그냥 없애면 안될까요? no_index의 힌트 힌트를 사용해야 하는 이유는 비즈니스 사용 시나리오가 너무 많기 때문입니다. 여기서는 이 인덱스를 다른 곳에서 사용하면 인덱스의 효율성이 크게 향상될 수 있습니다. 시간이 지나면 힌트의 장점이 강조됩니다. 이 문장만 사용하면 됩니다. 🎜

요약

Nest Loop Join은 응답이 가장 빠른 연결 방법이며 반환되는 데이터의 양이 적은 시나리오에 적합하다는 장점이 있습니다. 두 개의 큰 테이블이 연결되어 많은 양의 데이터가 반환되고 관련 필드의 인덱스가 상대적으로 비효율적일 경우 no_index 힌트를 사용하여 관련 필드의 비효율적인 인덱스를 비활성화하는 것이 더 효율적입니다. 필드, 최적화 프로그램이 해시 조인을 선택하라는 메시지를 표시합니다.

추천 학습: mysql 비디오 튜토리얼

위 내용은 MySQL 최적화 프로그램의 해시 조인 사용 방해의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:jb51.net
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿