데이터 베이스 MySQL 튜토리얼 MySQL8.0 InnoDB 병렬 실행에 대한 자세한 설명

MySQL8.0 InnoDB 병렬 실행에 대한 자세한 설명

Mar 27, 2020 am 08:58 AM

개요

MySQL은 수년간의 개발을 거쳐 가장 인기 있는 데이터베이스가 되었으며 인터넷 산업에서 널리 사용되며 점차 다양한 전통 산업에도 침투하고 있습니다. 인기가 높은 이유는 한편으로는 뛰어난 동시성 트랜잭션 처리 능력 때문이고, 다른 한편으로는 MySQL의 풍부한 생태계의 혜택도 누리고 있습니다. MySQL은 OLTP 시나리오에서 짧은 쿼리를 처리하는 데는 효과적이지만 복잡한 대규모 쿼리를 처리하는 능력은 제한되어 있습니다. 가장 직접적인 점은 SQL 문의 경우 MySQL은 이를 처리하기 위해 최대 하나의 CPU 코어만 사용할 수 있다는 것입니다. 이 시나리오에서는 호스트 CPU의 멀티 코어 기능을 사용할 수 없습니다. MySQL은 가만히 있지 않고 계속해서 발전해 나가고 있습니다. 새롭게 출시된 버전 8.0.14에서는 Check Table과 Select Count(*) 형태의 문의 성능을 두 배로 향상시킨 병렬 쿼리 기능을 최초로 도입했습니다. 현재 사용 시나리오는 여전히 상대적으로 제한되어 있지만 후속 개발은 기대할 가치가 있습니다.

권장: "mysql 비디오 튜토리얼"

사용 방법

innodb_parallel_read_threads 매개변수를 구성하여 병렬 검색 기능을 시작하여 동시 스레드 수를 설정합니다. 기본값은 4입니다. 여기서는 간단한 실험을 해보겠습니다. sysbench를 통해 2억 개의 데이터를 가져오고 각각 innodb_parallel_read_threads为1,2,4,8,16,32,64,测试并行执行的效果。测试语句为select count(*) from sbtest1;

MySQL8.0 InnoDB 병렬 실행에 대한 자세한 설명

을 구성하겠습니다. 가로 축은 구성된 동시 스레드 수이고 세로 축은 명령문 실행 시간입니다. 테스트 결과에 따르면, 전체 병렬 성능은 단일 스레드의 경우 18개에서 32개 스레드의 경우 1개로 감소한 2억 개의 레코드를 검색하는 데 여전히 좋습니다. 앞으로 아무리 동시성이 발전하더라도 제한된 데이터 양으로 인해 멀티 스레드의 관리 소비는 동시성이 가져온 성능 향상을 초과하며 SQL 실행 시간은 지속적으로 단축될 수 없습니다.

MySQL 병렬 실행

사실, 아래 그림과 같이 현재 MySQL의 병렬 실행은 아직 매우 초기 단계입니다. 왼쪽은 단일 SQL 형식의 이전 MySQL 직렬 처리입니다. 하나는 현재 MySQL 버전인 InnoDB에서 제공하는 병렬 기능입니다. 엔진 병렬 스캐닝의 형태는 MySQL이 향후 개발할 형태이며, 최적화 프로그램은 시스템 부하와 SQL을 기반으로 병렬 계획을 생성합니다. , 병렬 실행을 위해 파티션 계획을 실행자에게 보냅니다. 병렬 실행은 병렬 스캐닝뿐만 아니라 병렬 집계, 병렬 조인, 병렬 그룹화 및 병렬 정렬도 포함합니다. 현재 MySQL 버전의 상위 수준 최적화 프로그램 및 실행 프로그램에 대한 지원 수정은 없습니다. 따라서 다음 논의에서는 주로 분할, 병렬 스캐닝, 미리 읽기 및 실행기와 상호 작용하는 어댑터 클래스를 포함하여 InnoDB 엔진이 병렬 스캐닝을 구현하는 방법에 중점을 둡니다.

MySQL8.0 InnoDB 병렬 실행에 대한 자세한 설명

파티션

병렬 스캔의 핵심 단계는 스캔한 데이터를 여러 부분으로 나누고 여러 스레드가 병렬로 스캔할 수 있도록 하는 파티셔닝입니다. InnoDB 엔진은 인덱스로 구성된 테이블이며, 데이터는 B+트리 형태로 디스크에 저장되며, 동시에 핫 페이지는 버퍼 풀에 캐시됩니다. LRU 알고리즘을 통해 제거됩니다. 파티셔닝의 논리는 루트 노드 페이지에서 시작하여 레이어별로 스캔하는 것입니다. 특정 레이어의 분기 수가 구성된 스레드 수를 초과한다고 판단되면 분할이 중지됩니다. 구현 중에 실제로는 총 2개의 파티션이 수행됩니다. 첫 번째 파티션은 루트 노드 페이지의 분기 수에 따라 나누어집니다. 각 분기의 가장 왼쪽 리프 노드의 레코드는 왼쪽 하한입니다. 인접 상한으로 기록됩니다. 가지의 오른쪽 상한. 이런 방식으로 B+트리는 여러 개의 하위 트리로 나뉘며, 각 하위 트리는 스캔 파티션입니다. 첫 번째 파티션 이후에는 파티션 개수가 멀티코어를 충분히 활용하지 못하는 문제가 발생할 수 있습니다. 예를 들어 병렬 스캐닝 스레드를 3개로 구성하고, 첫 번째 파티션 이후에는 4개의 파티션이 생성되고, 처음 3개 파티션은 병렬로 완료되고, 네 번째 파티션은 최대 하나의 스레드로만 스캔할 수 있으며, 최종 결과는 멀티 코어 리소스를 완전히 활용할 수 없다는 것입니다.

보조 파티션

이 문제를 해결하기 위해 버전 8.0.17에서는 네 번째 파티션에 대해 분할을 계속 탐색하여 여러 하위 파티션을 동시에 스캔할 수 있으며 InnoDB 엔진이 스캔합니다. 동시에 가장 작은 세분성은 페이지 수준입니다. 2차 파티셔닝을 판단하는 구체적인 논리는 1차 파티셔닝 후 파티션 수가 스레드 수보다 크면 파티션 수가 스레드 수보다 큰 파티션은 2차 파티셔닝을 위해 계속되어야 한다는 것입니다. 스레드 수보다 적고 B+트리 수준이 매우 깊은 경우 모든 파티션에는 보조 파티셔닝이 필요합니다.

관련 코드는 다음과 같습니다.

split_point = 0;
if (ranges.size() > max_threads()) {
   //最后一批分区进行二次分区                                      
   split_point = (ranges.size() / max_threads()) * max_threads();          
 } else if (m_depth < SPLIT_THRESHOLD) {                                  
   /* If the tree is not very deep then don&#39;t split. For smaller tables    
   it is more expensive to split because we end up traversing more blocks*/
   split_point = max_threads();                                            
 } else {
   //如果B+tree的层次很深(层数大于或等于3,数据量很大),则所有分区都需要进行二次分区
 }
로그인 후 복사

주 파티션이든 보조 파티션이든 파티션 경계의 논리는 동일합니다. 각 파티션의 가장 왼쪽 리프 노드의 레코드는 왼쪽 하단 경계입니다. 레코드는 분기의 오른쪽 상단 경계로 기록됩니다. 이렇게 하면 충분한 파티션, 충분한 세분성 및 충분한 병렬성이 보장됩니다. 아래 그림은 2차 파티셔닝을 위한 3개의 동시 스레드 스캐닝 구성을 보여줍니다.

해당 코드는 다음과 같습니다.

MySQL8.0 InnoDB 병렬 실행에 대한 자세한 설명

create_ranges(size_t depth, size_t level)
一次分区:
parallel_check_table
 add_scan
   partition(scan_range, level=0)  /* start at root-page */
     create_ranges(scan_range, depth=0, level=0)
   create_contexts(range, index >= split_point)
二次分区:                                                      
split()
 partition(scan_range, level=1)
   create_ranges(depth=0,level)
로그인 후 복사

병렬 스캐닝

파티션 후에는 각 파티션 스캐닝 작업을 잠금 없는 대기열에 넣습니다. 병렬 작업자 스레드는 대기열에서 작업을 가져와서 스캐닝 작업을 실행합니다. 획득한 작업에 분할 속성이 있는 경우 작업자는 작업을 두 번 분할합니다. 그리고 대기열에 넣습니다. 이 프로세스에는 주로 두 개의 핵심 인터페이스가 포함됩니다. 하나는 작업자 스레드 인터페이스이고 다른 하나는 순회 기록 인터페이스입니다. 전자는 대기열에서 작업을 가져와 실행하고, 후자는 가시성을 기반으로 적절한 레코드를 획득하고 주입합니다. 계산 등의 상위 계층 콜백 기능 처리를 통해 수행됩니다.

Parallel_reader::worker(size_t thread_id)

{

1. ctx-queue

에서 ctx 작업을 추출합니다. 2. ctx의 분할 속성을 기반으로 파티션을 추가로 분할해야 하는지 결정합니다(split() )

3. 파티션의 모든 레코드를 순회합니다(traverse())

4. 파티션 작업이 끝난 후 m_n_completed 개수를 유지합니다.

5. m_n_compeleted 개수가 ctx 번호에 도달하면 모든 작업자 스레드를 깨워 종료합니다.

6. 트래버스 인터페이스에 따라 오류 정보를 반환합니다.

}

Parallel_reader::Ctx::traverse()

{

1. 범위에 따라 pcursor를 설정합니다

2. btree를 찾아 범위의 시작 위치에 커서를 놓습니다

3. 가시성 결정(check_visibility )

4. 보이는 경우 콜백 함수(예: 통계)에 따라 계산합니다.

5. 뒤로 이동하여 페이지의 마지막 레코드에 도달하면 사전 읽기 메커니즘을 시작합니다(submit_read_ahead)

6. 범위 초과 후 종료

}

동시에 버전 8.0.17에서는 IO 병목 현상으로 인한 병렬 효과 저하 문제를 피하기 위해 미리 읽기 메커니즘도 도입했습니다. 현재는 미리 읽기를 위한 스레드 개수를 구성할 수 없으며 코드에 2개의 스레드로 하드코딩되어 있습니다. 각 pre-read의 단위는 클러스터(InnoDB 파일은 세그먼트, 클러스터, 페이지의 3단계 구조로 관리된다. 클러스터는 연속된 페이지의 그룹이다.)이며, 크기에 따라 1M 또는 2M가 될 수 있다. 페이지 구성. 일반적인 16k 페이지 구성의 경우 매번 1M을 미리 읽으며 이는 64페이지입니다. 작업자 스레드는 스캔할 때 먼저 다음 인접 페이지가 클러스터의 첫 번째 페이지인지 확인하고, 그렇다면 사전 읽기 작업을 시작합니다. 미리 읽기 작업은 잠금 없는 대기열을 통해서도 캐시됩니다. 작업자 스레드는 생산자이고 미리 읽기 작업자는 소비자입니다. 모든 파티션 페이지가 겹치지 않으므로 미리 읽기 작업이 반복되지 않습니다.

Executor 상호 작용(어댑터)

사실 MySQL은 이후의 더욱 풍부한 병렬 실행을 준비하기 위해 상위 계층에서 사용할 어댑터 클래스 Parallel_reader_adapter를 캡슐화했습니다. 우선, 이 클래스는 레코드 형식의 문제를 해결하고 엔진 계층에서 스캔한 레코드를 MySQL 형식으로 변환해야 합니다. 이렇게 하면 실행자가 엔진을 인식할 필요가 없습니다. 레이어 형식이며 MySQL 형식으로 처리됩니다. 전체 프로세스는 조립 라인이며, 작업자 스레드는 지속적으로 엔진 계층에서 레코드를 읽는 동시에 상위 계층에서 레코드를 계속 처리합니다. 속도는 버퍼를 통해 균형을 이룰 수 있습니다. 전체 프로세스가 흐르는지 확인하세요. 기본 캐시 크기는 2M입니다. 버퍼가 캐시할 수 있는 MySQL 레코드 수는 테이블의 레코드 행 길이에 따라 결정됩니다. 핵심 프로세스는 주로 process_rows 인터페이스에 있습니다. 프로세스는 다음과 같습니다

process_rows

{

1. 엔진 레코드를 MySQL 레코드로 변환

2. 이 스레드의 버퍼 정보를 얻습니다(변환된 mysql 레코드 수와 상위 계층으로 전송된 수)

3. MySQL 레코드를 버퍼에 채우고 통계 m_n_read

를 자동 증가시킵니다. 4. 처리(예: 통계, 집계, 정렬 등)를 위한 콜백 함수를 호출합니다. 통계 자동 증가 m_n_send

}

호출자에 대해서는 테이블의 메타 정보 설정이 필요하며, 집계 처리, 정렬, 그룹화 등 레코드 처리를 위한 콜백 함수 주입이 필요합니다. 콜백 함수는 m_init_fn, m_load_fn 및 m_end_fn을 설정하여 제어됩니다.

요약

MySQL 8.0은 병렬 쿼리를 도입했지만 아직은 상대적으로 초보적이지만 실험을 통해 이미 MySQL 병렬 쿼리의 잠재력을 확인할 수 있었습니다. 명령문 실행은 멀티 코어 기능을 최대한 활용하여 응답 시간이 급격히 떨어졌습니다. 가까운 미래에 8.0에서는 병렬 집계, 병렬 연결, 병렬 그룹화, 병렬 정렬 등 더 많은 병렬 연산자를 지원할 것이라고 믿습니다.

위 내용은 MySQL8.0 InnoDB 병렬 실행에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

MySQL에서 인덱스를 사용하는 것보다 전체 테이블 스캔이 더 빠를 수 있습니까? MySQL에서 인덱스를 사용하는 것보다 전체 테이블 스캔이 더 빠를 수 있습니까? Apr 09, 2025 am 12:05 AM

전체 테이블 스캔은 MySQL에서 인덱스를 사용하는 것보다 빠를 수 있습니다. 특정 사례는 다음과 같습니다. 1) 데이터 볼륨은 작습니다. 2) 쿼리가 많은 양의 데이터를 반환 할 때; 3) 인덱스 열이 매우 선택적이지 않은 경우; 4) 복잡한 쿼리시. 쿼리 계획을 분석하고 인덱스 최적화, 과도한 인덱스를 피하고 정기적으로 테이블을 유지 관리하면 실제 응용 프로그램에서 최상의 선택을 할 수 있습니다.

Windows 7에 MySQL을 설치할 수 있습니까? Windows 7에 MySQL을 설치할 수 있습니까? Apr 08, 2025 pm 03:21 PM

예, MySQL은 Windows 7에 설치 될 수 있으며 Microsoft는 Windows 7 지원을 중단했지만 MySQL은 여전히 ​​호환됩니다. 그러나 설치 프로세스 중에 다음 지점이 표시되어야합니다. Windows 용 MySQL 설치 프로그램을 다운로드하십시오. MySQL의 적절한 버전 (커뮤니티 또는 기업)을 선택하십시오. 설치 프로세스 중에 적절한 설치 디렉토리 및 문자를 선택하십시오. 루트 사용자 비밀번호를 설정하고 올바르게 유지하십시오. 테스트를 위해 데이터베이스에 연결하십시오. Windows 7의 호환성 및 보안 문제에 주목하고 지원되는 운영 체제로 업그레이드하는 것이 좋습니다.

MySQL : 쉽게 학습하기위한 간단한 개념 MySQL : 쉽게 학습하기위한 간단한 개념 Apr 10, 2025 am 09:29 AM

MySQL은 오픈 소스 관계형 데이터베이스 관리 시스템입니다. 1) 데이터베이스 및 테이블 작성 : CreateAbase 및 CreateTable 명령을 사용하십시오. 2) 기본 작업 : 삽입, 업데이트, 삭제 및 선택. 3) 고급 운영 : 가입, 하위 쿼리 및 거래 처리. 4) 디버깅 기술 : 확인, 데이터 유형 및 권한을 확인하십시오. 5) 최적화 제안 : 인덱스 사용, 선택을 피하고 거래를 사용하십시오.

MySQL과 Mariadb가 공존 할 수 있습니다 MySQL과 Mariadb가 공존 할 수 있습니다 Apr 08, 2025 pm 02:27 PM

MySQL 및 MariaDB는 공존 할 수 있지만주의해서 구성해야합니다. 열쇠는 각 데이터베이스에 다른 포트 번호와 데이터 디렉토리를 할당하고 메모리 할당 및 캐시 크기와 같은 매개 변수를 조정하는 것입니다. 연결 풀링, 애플리케이션 구성 및 버전 차이도 고려해야하며 함정을 피하기 위해 신중하게 테스트하고 계획해야합니다. 두 개의 데이터베이스를 동시에 실행하면 리소스가 제한되는 상황에서 성능 문제가 발생할 수 있습니다.

Redshift Zero ETL과의 RDS MySQL 통합 Redshift Zero ETL과의 RDS MySQL 통합 Apr 08, 2025 pm 07:06 PM

데이터 통합 ​​단순화 : AmazonRdsMysQL 및 Redshift의 Zero ETL 통합 효율적인 데이터 통합은 데이터 중심 구성의 핵심입니다. 전통적인 ETL (추출, 변환,로드) 프로세스는 특히 데이터베이스 (예 : AmazonRDSMySQL)를 데이터웨어 하우스 (예 : Redshift)와 통합 할 때 복잡하고 시간이 많이 걸립니다. 그러나 AWS는 이러한 상황을 완전히 변경 한 Zero ETL 통합 솔루션을 제공하여 RDSMYSQL에서 Redshift로 데이터 마이그레이션을위한 단순화 된 거의 실시간 솔루션을 제공합니다. 이 기사는 RDSMYSQL ZERL ETL 통합으로 Redshift와 함께 작동하여 데이터 엔지니어 및 개발자에게 제공하는 장점과 장점을 설명합니다.

MySQL 사용자와 데이터베이스의 관계 MySQL 사용자와 데이터베이스의 관계 Apr 08, 2025 pm 07:15 PM

MySQL 데이터베이스에서 사용자와 데이터베이스 간의 관계는 권한과 테이블로 정의됩니다. 사용자는 데이터베이스에 액세스 할 수있는 사용자 이름과 비밀번호가 있습니다. 권한은 보조금 명령을 통해 부여되며 테이블은 Create Table 명령에 의해 생성됩니다. 사용자와 데이터베이스 간의 관계를 설정하려면 데이터베이스를 작성하고 사용자를 생성 한 다음 권한을 부여해야합니다.

Bangla 부분 모델 검색의 Laravel Eloquent Orm) Bangla 부분 모델 검색의 Laravel Eloquent Orm) Apr 08, 2025 pm 02:06 PM

Laraveleloquent 모델 검색 : 데이터베이스 데이터를 쉽게 얻을 수 있습니다. 이 기사는 데이터베이스에서 데이터를 효율적으로 얻는 데 도움이되는 다양한 웅변 모델 검색 기술을 자세히 소개합니다. 1. 모든 기록을 얻으십시오. 모든 () 메소드를 사용하여 데이터베이스 테이블에서 모든 레코드를 가져옵니다. 이것은 컬렉션을 반환합니다. Foreach 루프 또는 기타 수집 방법을 사용하여 데이터에 액세스 할 수 있습니다 : Foreach ($ postas $ post) {echo $ post->

MySQL : 초보자를위한 데이터 관리의 용이성 MySQL : 초보자를위한 데이터 관리의 용이성 Apr 09, 2025 am 12:07 AM

MySQL은 설치가 간단하고 강력하며 데이터를 쉽게 관리하기 쉽기 때문에 초보자에게 적합합니다. 1. 다양한 운영 체제에 적합한 간단한 설치 및 구성. 2. 데이터베이스 및 테이블 작성, 삽입, 쿼리, 업데이트 및 삭제와 같은 기본 작업을 지원합니다. 3. 조인 작업 및 하위 쿼리와 같은 고급 기능을 제공합니다. 4. 인덱싱, 쿼리 최적화 및 테이블 파티셔닝을 통해 성능을 향상시킬 수 있습니다. 5. 데이터 보안 및 일관성을 보장하기위한 지원 백업, 복구 및 보안 조치.

See all articles