InnoDB Adaptive Hash Index调研总结

Adaptive Hash Index的维护

B+树叶页面进入Adaptive Hash Index

B+树叶页面进入Hash Index的条件

B+树叶页面Adaptive Hash Index维护

Adaptive Hash Index的使用流程

参考资料

집

데이터 베이스

MySQL 튜토리얼

InnoDB Adaptive Hash Index浅析

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 04:37 PM

hash index innodb

InnoDB Adaptive Hash Index调研总结 #InnoDB Adaptive Hash Index# 定义维护索引叶页面中所有记录的索引键值(或键值前缀)到索引叶页面位置的Hash映射关系，能够根据索引键值(前缀)快速定位到叶页面满足条件记录的Offset，减少了B+树Search Path的代价，将B

InnoDB Adaptive Hash Index调研总结

#InnoDB Adaptive Hash Index# 定义

维护索引叶页面中所有记录的索引键值(或键值前缀)到索引叶页面位置的Hash映射关系，能够根据索引键值(前缀)快速定位到叶页面满足条件记录的Offset，减少了B+树Search Path的代价，将B+树从Root页面至Leaf页面的路径定位，优化为Hash Index的快速查询。

#InnoDB Adaptive Hash Index# 使用

Adaptive Hash Index是针对B+树Search Path的优化，因此所有会涉及到Search Path的操作，均可使用此Hash索引进行优化，这些可优化的操作包括：Unique Scan/Range Scan(Locate First Key Page)/Insert/Delete/Purge等等，几乎涵盖InnoDB所有的操作类型。

#InnoDB Adaptive Hash Index# 维护

Adaptive，意味着不是所有的叶页面都会以Hash索引维护，叶页面进入Hash索引的条件是：同种类型的操作(Scan/Insert…)，命中同一叶页面的次数，超过此页面记录数量的1/16，则可将当前叶页面加入Hash索引，用以优化后续可能的相同Search Path。

#InnoDB Adaptive Hash Index#

Adaptive Hash Index，是一个临时的Hash索引(针对一类特定的语句进行的优化，一般而言，当前的Hash优化，对于下一条语句，不一定有用)，针对不同的Scan/Insert/Delete，Search Path的条件不同，导致最终提取出来的Search Info的n_fields与n_bytes也不同(n_fileds + b_bytes构成了索引的键值前缀，或者是完整的索引键值)，同一页面的前一个Hash索引，在下一个查询中可能就失效了。此时，进行hash guess会失败(会设置Search Info的last_hash_succ = false，接下来不会使用此Hash Index)，在Search Path之后，进行Hash索引的更新(btr0sea.ic::btr_search_info_update())，会重设Search Info的n_fields，n_bytes，进而重设buffer header上的n_fields，n_bytes，在满足页面重新进入Hash Index的条件之后(见下面的分析，一共有三个条件)，当判断出buffer header上的[n_fields, n_bytes]与[curr_n_fields, curr_n_bytes]不同，则对页面重新进行Hash计算，步骤是：
- 首先删除页面旧的Hash索引项；
- 然后根据[n_fields, n_bytes]组合计算新的Hash索引项，存入Hash Index；

#InnoDB Adaptive Hash Index#

对需要维护Hash Index的B+树索引叶页面，按照一定的[n_fields, n_bytes]组合，提取索引键值前缀，计算hash值，维护页内所有Records至叶页面offset的Hash项。但是，由于index->search_info是索引全局所有的，其中保存的[n_fields, n_bytes]会根据不同的SQL语句发生变化，此组合一变，原来进入Hash索引的项就无法摘除了(计算Hash值也会变化，找不到原有的Hash项)。因此，InnoDB在每一个Buffer Header上维护了自身进入Hash索引时的[n_fields, n_bytes]组合，后续根据此组合可以将页面对应的Hash项完全删除。更进一步，Buffer Header之上还有[curr_n_fields, curr_n_bytes]组合，这个标识的当前页面在Hash索引中真正使用的组合。Buffer Header上维护两组[n_fields, n_bytes]，[curr_n_fields, curr_n_bytes]的目的：
- [n_fields, n_bytes]
  
  此组合随着index->search_info上的[n_fields, n_bytes]组合的变化而变化，若二者不同，则更新Buffer Header组合，重新开始统计新的组合潜在可用的次数(n_hash_helps)；
- [curr_n_fields, curr_n_bytes]
  
  此组合维护的是叶页面进入Hash Index时使用的索引键值前缀组合。在将页面从Hash索引删除时，需要根据此组合构建Hash值删除hash索引项；若此组合与buffer header上的[n_fields, n_bytes]组合不同，并且满足了页面重新进入Hash索引的条件，则按照新的[n_fields, n_bytes]组合计算Hash值，维护页面的hash索引。

Adaptive Hash Index的维护

Adaptive Hash Index的维护，包括多个动作：索引叶页面何时进入Hash Index；何时可以使用Hash Index加锁查询；何时将索引叶页面从Hash Index中移除，等等。

B+树叶页面进入Adaptive Hash Index

新增B+树索引叶页面的Hash索引，则是在Search Path之后，btr_cur_search_to_nth_level() -> btr0sea.ic::btr_search_info_update()。

B+树叶页面进入Hash Index的条件

InnoDB不是每一次进行Search Path之后，就将当前定位到的叶页面中的所有Records按照键值前缀做Hash，并存入Hash表，而是有至少三个前提：

前提一：一定的次数的Search Path(btr_search_info_update()函数)：

#define BTR_SEARCH_HASH_ANALYSIS ? ? ? ? ? ? ? ?17

/* After change in n_fields or n_bytes in info, this many rounds are waited before starting the hash analysis again: this is to save CPU time when there is no hope in building a hash index. */
前提二：同种类型的查询(给定索引键值或索引前缀)，通过Search Path命中同一叶页面的次数，超过页面记录数量的1/16 (页面级别约束)：

/* 更新Buffer Header上的Adaptive Hash Index相关信息：Search Info */

btr0sea.cc::btr_search_update_block_hash_info();

…

// block->n_hash_helps

// ? ? 表示当前索引键值(前缀)Hash索引，针对

// ? ? 当前block有效的次数，定位到此Block的Search Path可优化；

// BTR_SEARCH_PAGE_BUILD_LIMIT(16)

// ? ? 定义了是否启用页面Hash Index的

// ? ? 下限，当n_hash_helps值超过页面记录数的

// ? ?BTR_SEARCH_PAGE_BUILD_LIMIT分之一，则可以将此页面进行Hash索引；

if ((block->n_hash_helps > page_get_n_recs() / BTR_SEARCH_PAGE_BUILD_LIMIT)

&& (info->n_hash_potential >= BTR_SEARCH_BUILD_LIMIT))

…

return(TRUE);

前提三：查询已经连续成功使用Hash Index，或者是可能成功使用Hash Index的次数 (索引级别约束)：

btr0sea.cc::btr_search_update_block_hash_info();

…

// info->n_hash_potential

// ? ? 表示查询已经连续成功使用Hash Index，

// ? ? 或者是可能成功使用Hash Index的次数；

//BTR_SEARCH_BUILD_LIMIT

// ? ?相同索引键值(键值前缀)，针对当前索引

// ? ? Search Pach能够以Hash Index优化的次数，索引级别的；

if ((block->n_hash_helps > page_get_n_recs() / BTR_SEARCH_PAGE_BUILD_LIMIT)

&& (info->n_hash_potential >= BTR_SEARCH_BUILD_LIMIT))

…

return(TRUE);

B+树叶页面Adaptive Hash Index维护

一个B+树索引叶页面，对其进行Hash Index索引的流程：

btr0cur.cc::btr_cur_search_to_nth_level();

btr0sea.ic::btr_search_info_update();

btr0sea.cc::btr_search_info_update_slow();

// 根据当前Search Path的定位结果(cursor)，以及Index的

// hash Index search info，重新计算Hash索引所需要的Key，

// 是完整的索引键值，或者是索引键值前缀

// 此处的判断逻辑较为复杂，需要持续学习！！

btr_search_info_update_hash();

…

// 根据前面提到的，判断当前页面是否需要进行Hash索引

btr_search_update_block_hash_info();

// 对当前页面中的所有记录，创建Hash索引，Hash键值为前面

// 提到的提取出来的完整索引键值或者键值前缀

// 若当前页面已经被Hash，则首先删除旧的Hash，然后增加新Hash

// 注意：

// 1. buffer header上有一个重要的参数——left_side，用于控制

// 拥有相同hash值的记录，是保持第一条，还是保存最后一条

// 2. index->search_info->ref_count：此参数用于标识当前索引有多少

// 页面被Hash索引了，在删除、关闭索引前，需要保证此计数归零

btr_search_build_page_hash_index();

Adaptive Hash Index的使用流程

Adaptive Hash Index的使用流程：

btr0cur.c::btr_cur_search_to_nth_level();

btr0sea.c::btr_search_guess_on_hash();

// 获取上一个进入Hash Index的叶页面，使用了索引中的多少个完全列，

// 以及最后一列使用了多少个Bytes用于计算Hash键值

cursor->n_fields = index->search_info->n_fields;

cursor->n_bytes = index->search_info->n_bytes;

// 根据选择的索引键值前缀，计算给定Tuple对应的Hash索引值

// 前提是，必须保证给定Tuple的列数量，要超过键值前缀数量；

fold = dtuple_fold(tuple, cursor->n_fields, cursor->n_bytes, index_id);

// 根据计算得来的fold，查询Adaptive Hash Index；

ha_search_and_get_data(btr_search_sys->hash_index, fold);

…

// 检查当前Hash Index命中的叶页面，是否满足Search Path的条件

btr0sea.cc::btr_search_check_guess();

page0page.ic::page_cmp_dtuple_rec_with_match();

// 对比叶页面中通过Hash Index定位到的当前记录，以及

// 用户给定的tuple (完整 or Partial)，n_cmp为对比的列数，

// matched_fields为完全匹配的列数，*_bytes为第一个不匹配

// 列中匹配的字节数

// @return 1, 0, -1

// 1： ? ?dtuple大于页面中的rec

// 0： ? ?dtuple与页面中的rec相等

// -1： ? ?dtuple小于页面中的rec

rem0cmp.cc::cmp_dtuple_rec_with_match_low(dtuple, rec,

offsets, n_cmp, matched_fields, matched_bytes);

// 设置本次完全匹配的列数，以及最后一列匹配的字节数

*matched_fields = cur_field;

*matched_bytes = cur_bytes;

// 若查询模式为L or LE，则判断当前位置是否满足条件：

// 1. 条件一：当前Rec是否比查询条件更小

if (mode == PAGE_CUR_L)

if (cmp != 1)

goto exit_func;

// 2. 条件二：当前Record的下一条记录比查询条件更大

// (一). ?next_rec为SUPREMUM记录，并且当前页面为索引最后一个页面

// 则一定满足条件；

// (二). ?next_rec不为SUPREMUM记录，则比较next_rec与tuple，判断

// 比较的返回值是否为-1，标识tuple小于next_rec;

if((mode == PAGE_CUR_L) || (mode == PAGE_CUR_LE))

next_rec = page_rec_get_next(rec);

// 总结：当以上的条件均满足时，说明当前通过Hash Index定位的叶节点的位置是正确的。

// Hash Index命中，减少了B+-Tree Search Path开销，直接定位到了叶页面的正确位置

// 接下来，根据操作类型的不同，可以进行接下来的操作，例如：

// Range Scan操作：从当前位置开始，读取Range的第一条记录

// Unique Scan操作：从当前位置，读取满足Unique记录

// Insert操作：将记录Insert到当前位置；

// Delete操作：删除当前位置的记录;

参考资料

[1] http://dev.mysql.com/doc/refman/5.5/en/innodb-adaptive-hash.html ? ? ? ?Adaptive Hash Indexes

原文地址：InnoDB Adaptive Hash Index浅析, 感谢原作者分享。

본 웹사이트의 성명

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7569

Cakephp 튜토리얼

1386

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

107

Related knowledge

index.html은 어떤 파일인가요? Feb 19, 2024 pm 01:36 PM

index.html은 웹 페이지의 홈 페이지 파일을 나타내며 웹 사이트의 기본 페이지입니다. 사용자가 웹사이트를 방문하면 일반적으로 index.html 페이지가 먼저 로드됩니다. HTML(HypertextMarkupLanguage)은 웹 페이지를 만드는 데 사용되는 마크업 언어이며 index.html도 HTML 파일입니다. 여기에는 웹페이지의 구조와 콘텐츠는 물론 서식 지정과 레이아웃에 사용되는 태그와 요소도 포함됩니다. 다음은 index.html 코드의 예입니다. &lt

mysql innodb가 뭐야? Apr 14, 2023 am 10:19 AM

InnoDB는 MySQL의 데이터베이스 엔진 중 하나이며 현재 MySQL AB의 바이너리 릴리스 표준 중 하나입니다. InnoDB는 이중 트랙 인증 시스템을 채택합니다. 하나는 GPL 인증이고 다른 하나는 독점 소프트웨어입니다. 권한 부여. InnoDB는 트랜잭션 데이터베이스에 선호되는 엔진이며 트랜잭션 보안 테이블(ACID)을 지원합니다. InnoDB는 최대 범위의 동시성을 지원할 수 있는 행 수준 잠금을 지원합니다.

MySQL이 바이너리 콘텐츠에서 InnoDB 행 형식을 보는 방법 Jun 03, 2023 am 09:55 AM

InnoDB는 디스크의 테이블에 데이터를 저장하는 스토리지 엔진이므로 종료하고 다시 시작한 후에도 데이터가 계속 존재합니다. 실제 데이터 처리 과정은 메모리에서 일어나므로 디스크에 있는 데이터를 메모리에 로드해야 하며, 쓰기나 수정 요청을 처리하는 경우에도 메모리에 있는 내용을 디스크에 새로 고쳐야 합니다. 그리고 우리는 디스크를 읽고 쓰는 속도가 매우 느리다는 것을 알고 있습니다. 이는 메모리에서 읽고 쓰는 것과는 몇 배 정도 다릅니다. 따라서 테이블에서 특정 레코드를 얻으려면 InnoDB 스토리지 엔진이 읽어야 합니다. 디스크의 레코드가 하나씩? InnoDB가 채택한 방식은 데이터를 여러 페이지로 나누고, 디스크와 메모리 간 상호 작용의 기본 단위로 페이지를 사용하는 것입니다. InnoDB의 페이지 크기는 일반적으로 16입니다.

PHP에서 Redis Hash 작업을 구현하는 방법 May 30, 2023 am 08:58 AM

해시 연산 //해시 테이블의 필드에 값을 할당합니다. 성공하면 1을, 실패하면 0을 반환합니다. 해시 테이블이 없으면 테이블이 먼저 생성된 후 값이 할당됩니다. 필드가 이미 있으면 이전 값을 덮어씁니다. $ret=$redis->hSet('user','realname','jetwu');//해시 테이블에서 지정된 필드의 값을 가져옵니다. 해시 테이블이 없으면 false를 반환합니다. $ret=$redis->hGet('사용자','지역

mysql innodb 예외를 처리하는 방법 Apr 17, 2023 pm 09:01 PM

1. mysql을 롤백하고 다시 설치합니다. 다른 위치에서 이 데이터를 가져오는 문제를 방지하려면 먼저 현재 라이브러리의 데이터베이스 파일(/var/lib/mysql/location)을 백업합니다. 다음으로 Perconaserver5.7 패키지를 제거하고 원래의 이전 5.1.71 패키지를 다시 설치하고 mysql 서비스를 시작했는데 Unknown/unsupportedtabletype:innodb 메시지가 표시되어 정상적으로 시작할 수 없었습니다. 11050912:04:27InnoDB:버퍼풀 초기화 중, 크기=384.0M11050912:04:27InnoDB:완료

MySQL 스토리지 엔진 선택 비교: InnoDB, MyISAM 및 메모리 성능 지수 평가 Jul 26, 2023 am 11:25 AM

MySQL 스토리지 엔진 선택 비교: InnoDB, MyISAM 및 메모리 성능 지수 평가 소개: MySQL 데이터베이스에서 스토리지 엔진의 선택은 시스템 성능과 데이터 무결성에 중요한 역할을 합니다. MySQL은 다양한 스토리지 엔진을 제공하며, 가장 일반적으로 사용되는 엔진으로는 InnoDB, MyISAM 및 Memory가 있습니다. 이 기사에서는 이 세 가지 스토리지 엔진의 성능 지표를 평가하고 코드 예제를 통해 비교합니다. 1. InnoDB 엔진 InnoDB는 나의 것

Mysql의 innoDB에서 팬텀 읽기를 해결하는 방법 May 27, 2023 pm 03:34 PM

1. Mysql 트랜잭션 격리 수준 이 네 가지 격리 수준은 여러 트랜잭션 동시성 충돌이 있는 경우 더티 읽기, 반복 불가능 읽기 및 팬텀 읽기 문제가 발생할 수 있으며 innoDB는 반복 읽기 격리 수준 모드에서 이를 해결합니다. 2. 팬텀 읽기란 동일한 트랜잭션에서 첫 번째 트랜잭션에서 범위 쿼리를 실행한 것처럼 전후에 동일한 범위를 두 번 쿼리했을 때 얻은 결과가 일치하지 않는 것을 의미합니다. 이때 조건에 맞는 데이터는 1개뿐이며, 두 번째 트랜잭션에서는 데이터 행을 삽입하여 제출합니다. 첫 번째 쿼리입니다. 첫 번째 트랜잭션의 첫 번째 쿼리와 두 번째 쿼리는 모두 동일합니다.

Laravel 개발: Laravel Hash를 사용하여 비밀번호 해시를 생성하는 방법은 무엇입니까? Jun 17, 2023 am 10:59 AM

Laravel은 현재 가장 인기 있는 PHP 웹 프레임워크 중 하나이며 개발자에게 많은 강력한 기능과 구성 요소를 제공하며 LaravelHash도 그 중 하나입니다. LaravelHash는 비밀번호를 안전하게 유지하고 애플리케이션의 사용자 데이터를 더욱 안전하게 만드는 데 사용할 수 있는 비밀번호 해싱용 PHP 라이브러리입니다. 이 글에서는 LaravelHash의 작동 방식과 이를 사용하여 비밀번호를 해시하고 확인하는 방법을 알아봅니다. 라라 학습을 위한 필수 지식

See all articles

InnoDB Adaptive Hash Index浅析

InnoDB Adaptive Hash Index调研总结

Adaptive Hash Index的维护

B+树叶页面进入Adaptive Hash Index

B+树叶页面进入Hash Index的条件

B+树叶页面Adaptive Hash Index维护

Adaptive Hash Index的使用流程

参考资料

핫 AI 도구

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제