이 기사는 데이터 페이지, 캐시 페이지 무료 연결 목록, 플러시 연결 목록, LRU 연결 목록 청크 등을 포함하여 MySQL의 버퍼 풀에 대한 관련 지식을 제공합니다. 도움이 되기를 바랍니다.
이전 대화를 통해 우리는 InnoDB
를 스토리지 엔진으로 사용하는 테이블의 경우 사용자 데이터를 저장하는 데 사용되는 인덱스(클러스터링 포함)에 관계없이 알고 있습니다. 인덱스 및 보조 인덱스) 또는 다양한 시스템 데이터가 페이지
형식으로 테이블스페이스
에 저장되며, 소위 테이블스페이스
code>는 파일 시스템에 있는 하나 또는 여러 개의 실제 파일을 InnoDB
에서 추상화한 것에 지나지 않습니다. 즉, 결국 데이터가 여전히 디스크에 저장되어 있다는 의미입니다. 하지만 디스크의 속도가 거북이만큼 느리다는 것도 모두가 알고 있습니다. "바람처럼 빠르고 전기만큼 빠른" CPU
가 과연 그럴 만한 가치가 있을까요? 따라서 InnoDB
스토리지 엔진은 클라이언트의 요청을 처리할 때 특정 페이지의 데이터에 액세스해야 할 때 전체 페이지의 모든 데이터를 메모리에 로드합니다. 페이지당 하나의 레코드만 액세스하면 되더라도 전체 페이지의 데이터를 먼저 메모리에 로드해야 합니다. 전체 페이지를 메모리에 로드한 후 읽기 및 쓰기 액세스를 수행할 수 있으며, 읽기 및 쓰기 액세스를 완료한 후 페이지에 해당하는 메모리 공간을 서두르지 않고 캐시
합니다. 이렇게 하면 나중에 해당 페이지에 다시 접근하라는 요청이 있을 때 디스크 IO
의 오버헤드를 절약할 수 있습니다. InnoDB
作为存储引擎的表来说,不管是用于存储用户数据的索引(包括聚簇索引和二级索引),还是各种系统数据,都是以页
的形式存放在表空间
中的,而所谓的表空间
只不过是InnoDB
对文件系统上一个或几个实际文件的抽象,也就是说我们的数据说到底还是存储在磁盘上的。但是各位也都知道,磁盘的速度慢的跟乌龟一样,怎么能配得上“快如风,疾如电”的CPU
呢?所以InnoDB
存储引擎在处理客户端的请求时,当需要访问某个页的数据时,就会把完整的页的数据全部加载到内存中,也就是说即使我们只需要访问一个页的一条记录,那也需要先把整个页的数据加载到内存中。将整个页加载到内存中后就可以进行读写访问了,在进行完读写访问之后并不着急把该页对应的内存空间释放掉,而是将其缓存
起来,这样将来有请求再次访问该页面时,就可以省去磁盘IO
的开销了。
设计InnoDB
的大叔为了缓存磁盘中的页,在MySQL
服务器启动的时候就向操作系统申请了一片连续的内存,他们给这片内存起了个名,叫做Buffer Pool
(中文名是缓冲池
)。那它有多大呢?这个其实看我们机器的配置,如果你是土豪,你有512G
内存,你分配个几百G作为Buffer Pool
也可以啊,当然你要是没那么有钱,设置小点也行呀~ 默认情况下Buffer Pool
只有128M
大小。当然如果你嫌弃这个128M
太大或者太小,可以在启动服务器的时候配置innodb_buffer_pool_size
参数的值,它表示Buffer Pool
的大小,就像这样:
[server] innodb_buffer_pool_size = 268435456
其中,268435456
的单位是字节,也就是我指定Buffer Pool
的大小为256M
。需要注意的是,Buffer Pool
也不能太小,最小值为5M
(当小于该值时会自动设置成5M
)。
Buffer Pool
中默认的缓存页大小和在磁盘上默认的页大小是一样的,都是16KB
。为了更好的管理这些在Buffer Pool
中的缓存页,设计InnoDB
的大叔为每一个缓存页都创建了一些所谓的控制信息
,这些控制信息包括该页所属的表空间编号、页号、缓存页在Buffer Pool
中的地址、链表节点信息、一些锁信息以及LSN
信息(锁和LSN
我们之后会具体唠叨,现在可以先忽略),当然还有一些别的控制信息,我们这就不全唠叨一遍了,挑重要的说嘛~
每个缓存页对应的控制信息占用的内存大小是相同的,我们就把每个页对应的控制信息占用的一块内存称为一个控制块
吧,控制块和缓存页是一一对应的,它们都被存放到 Buffer Pool 中,其中控制块被存放到 Buffer Pool 的前边,缓存页被存放到 Buffer Pool 后边,所以整个Buffer Pool
对应的内存空间看起来就是这样的:
咦?控制块和缓存页之间的那个碎片
是个什么玩意儿?你想想啊,每一个控制块都对应一个缓存页,那在分配足够多的控制块和缓存页后,可能剩余的那点儿空间不够一对控制块和缓存页的大小,自然就用不到喽,这个用不到的那点儿内存空间就被称为碎片
了。当然,如果你把Buffer Pool
的大小设置的刚刚好的话,也可能不会产生碎片
InnoDB
를 설계한 삼촌은 MySQL서버가 시작될 때 운영 체제에서 연속 메모리 조각을 적용했습니다. 그들은 이 메모리에 버퍼 풀
(중국어 이름은 )이라는 이름을 부여했습니다. 버퍼 풀
>). 그럼 얼마나 크나요? 이는 실제로 우리 시스템의 구성에 따라 다릅니다. 당신이 부유하고 512G
메모리를 가지고 있다면, 수백 G를 버퍼 풀
로 할당할 수 있습니다. 그건 없어요 돈이 있으면 더 작게 설정하시면 됩니다~ 기본적으로 버퍼 풀
의 크기는 128M
에 불과합니다. 물론, 이 128M
이 너무 크거나 너무 작은 것이 싫다면 서버 시작 시 Buffer를 나타내는 <code>innodb_buffer_pool_size
매개변수의 값을 구성할 수 있습니다. Pool 크기는 이렇습니다. 🎜mysql> SHOW VARIABLES LIKE 'innodb_old_blocks_pct'; +-----------------------+-------+ | Variable_name | Value | +-----------------------+-------+ | innodb_old_blocks_pct | 37 | +-----------------------+-------+ 1 row in set (0.01 sec)
268435456
의 단위는 바이트, 즉 Buffer Pool
의 크기를 로 지정했습니다. 2억 5600만
. 버퍼 풀
은 너무 작아서는 안 됩니다. 최소값은 5M
입니다(이 값보다 작을 경우 자동으로 5M으로 설정됩니다).
). 🎜버퍼 풀
의 기본 캐시 페이지 크기는 디스크의 기본 페이지 크기와 동일하며 둘 다 16KB. 버퍼 풀
에서 이러한 캐시 페이지를 더 잘 관리하기 위해 InnoDB
를 설계한 삼촌은 각 캐시 페이지에 대해 소위 제어 정보
를 만들었습니다. code>, 이러한 제어 정보에는 테이블스페이스 번호, 페이지 번호, 버퍼 풀
의 캐시 페이지 주소, 연결 목록 노드 정보, 일부 잠금 정보 및 LSN
정보(잠금 및 LSN
에 대해서는 나중에 자세히 설명하겠습니다. 지금은 무시해도 됩니다.) 그리고 물론 다른 제어 정보도 여기서 모두 다루지는 않겠습니다. 중요한 것만 골라 보겠습니다~🎜 🎜 각 캐시 페이지에 해당하는 제어 정보가 차지하는 메모리 크기는 동일합니다. 각 페이지에 해당하는 제어 정보가 차지하는 메모리를 제어 블록과 캐시 페이지라고 부르겠습니다. Buffer Pool 앞에는 Control Block이 저장되고, Buffer Pool 뒤에는 캐시 페이지가 저장된다. 버퍼 풀
다음과 같습니다: 🎜🎜🎜에? 제어 블록과 캐시 페이지 사이에 있는 조각
은 무엇인가요? 생각해 보면 각 제어 블록은 캐시 페이지에 해당합니다. 제어 블록과 캐시 페이지를 충분히 할당한 후에는 제어 블록과 캐시 페이지 쌍을 위한 남은 공간이 충분하지 않을 수 있으므로 여기서는 당연히 사용되지 않습니다. 사용되지 않는 약간의 메모리 공간을 조각화
라고 합니다. 물론, 버퍼 풀
의 크기를 알맞게 설정하면 프래그먼트
가 생성되지 않을 수도 있습니다~🎜
팁: 각 제어 블록은 캐시 페이지 크기의 약 5%를 차지합니다. MySQL 5.7.21 버전에서 각 제어 블록의 크기는 808바이트입니다. 우리가 설정한 innodb_buffer_pool_size에는 제어 블록의 이 부분이 차지하는 메모리 공간이 포함되지 않습니다. 즉, InnoDB가 버퍼 풀을 위해 운영 체제에서 연속 메모리 공간을 적용할 때 이 연속 메모리 공간은 일반적으로 5배 더 큽니다. innodb_buffer_pool_size의 값입니다.
MySQL
서버를 처음 시작하면 먼저 적용할 버퍼 풀
의 초기화 과정을 완료해야 합니다. 운영 체제버퍼 풀은 여러 쌍의 제어 블록과 캐시 페이지로 나뉩니다. 그러나 현재는 버퍼 풀
에 실제 디스크 페이지가 캐시되지 않습니다(아직 사용되지 않았기 때문입니다). 나중에 프로그램이 실행될 때 디스크의 페이지는 에 계속 캐시됩니다. > >버퍼 풀
. 따라서 문제는 디스크에서 버퍼 풀
로 페이지를 읽을 때 캐시 페이지의 어디에 배치해야 하느냐는 것입니다. 아니면 버퍼 풀
에서 사용 가능한 캐시 페이지와 사용된 캐시 페이지를 어떻게 구별할 수 있나요? 버퍼 풀에서 어떤 캐시 페이지를 사용할 수 있는지 기록하는 것이 좋습니다. 이때 캐시 페이지에 해당하는 제어 블록
이 있으면 모든 사용 가능한 캐시 페이지를 제어 블록에 매핑할 수 있습니다. 연결 목록의 노드로 배치됩니다. 이 연결 목록은 자유 연결 목록
(또는 자유 연결 목록)이라고도 합니다. 방금 초기화된 버퍼 풀
의 캐시 페이지는 모두 free이므로 각 캐시 페이지에 해당하는 제어 블록이 free linked list
에 추가됩니다. 코드>버퍼 풀에 수용할 수 있는 캐시 페이지 수는 n
입니다. 자유 연결 목록
을 추가하면 다음과 같습니다. MySQL
服务器的时候,需要完成对Buffer Pool
的初始化过程,就是先向操作系统申请Buffer Pool
的内存空间,然后把它划分成若干对控制块和缓存页。但是此时并没有真实的磁盘页被缓存到Buffer Pool
中(因为还没有用到),之后随着程序的运行,会不断的有磁盘上的页被缓存到Buffer Pool
中。那么问题来了,从磁盘上读取一个页到Buffer Pool
中的时候该放到哪个缓存页的位置呢?或者说怎么区分Buffer Pool
中哪些缓存页是空闲的,哪些已经被使用了呢?我们最好在某个地方记录一下Buffer Pool中哪些缓存页是可用的,这个时候缓存页对应的控制块
就派上大用场了,我们可以把所有空闲的缓存页对应的控制块作为一个节点放到一个链表中,这个链表也可以被称作free链表
(或者说空闲链表)。刚刚完成初始化的Buffer Pool
中所有的缓存页都是空闲的,所以每一个缓存页对应的控制块都会被加入到free链表
中,假设该Buffer Pool
中可容纳的缓存页数量为n
,那增加了free链表
的效果图就是这样的:
从图中可以看出,我们为了管理好这个free链表
,特意为这个链表定义了一个基节点
,里边儿包含着链表的头节点地址,尾节点地址,以及当前链表中节点的数量等信息。这里需要注意的是,链表的基节点占用的内存空间并不包含在为Buffer Pool
申请的一大片连续内存空间之内,而是单独申请的一块内存空间。
小贴士: 链表基节点占用的内存空间并不大,在MySQL5.7.21这个版本里,每个基节点只占用40字节大小。后边我们即将介绍许多不同的链表,它们的基节点和free链表的基节点的内存分配方式是一样一样的,都是单独申请的一块40字节大小的内存空间,并不包含在为Buffer Pool申请的一大片连续内存空间之内。
有了这个free链表
之后事儿就好办了,每当需要从磁盘中加载一个页到Buffer Pool
中时,就从free链表
中取一个空闲的缓存页,并且把该缓存页对应的控制块
的信息填上(就是该页所在的表空间、页号之类的信息),然后把该缓存页对应的free链表
节点从链表中移除,表示该缓存页已经被使用了~
我们前边说过,当我们需要访问某个页中的数据时,就会把该页从磁盘加载到Buffer Pool
中,如果该页已经在Buffer Pool
中的话直接使用就可以了。那么问题也就来了,我们怎么知道该页在不在Buffer Pool
中呢?难不成需要依次遍历Buffer Pool
中各个缓存页么?一个Buffer Pool
中的缓存页这么多都遍历完岂不是要累死?
再回头想想,我们其实是根据表空间号 + 页号
来定位一个页的,也就相当于表空间号 + 页号
是一个key
,缓存页
就是对应的value
,怎么通过一个key
来快速找着一个value
呢?哈哈,那肯定是哈希表喽~
小贴士: 啥?你别告诉我你不知道哈希表是个啥?我们这个文章不是讲哈希表的,如果你不会那就去找本数据结构的书看看吧~ 啥?外头的书看不懂?别急,等我~
所以我们可以用表空间号 + 页号
作为key
,缓存页
作为value
创建一个哈希表,在需要访问某个页的数据时,先从哈希表中根据表空间号 + 页号
看看有没有对应的缓存页,如果有,直接使用该缓存页就好,如果没有,那就从free链表
무료 연결 목록
을 관리하기 위해 우리는 이 연결 목록에 대해 특별히 기본 노드
를 정의했습니다. 링크드 리스트의 헤드 노드 주소, 테일 노드 주소, 현재 링크드 리스트의 노드 수 및 기타 정보. 여기서 주목해야 할 점은 연결리스트의 기본 노드가 차지하는 메모리 공간은 버퍼 풀
이 적용된 대용량 연속 메모리 공간에는 포함되지 않고, 별도의 메모리 공간이 적용된 부분이라는 점입니다. 을 위한. 🎜🎜🎜팁: 연결 리스트의 기본 노드가 차지하는 메모리 공간은 크지 않습니다. MySQL5.7.21 버전에서는 각 기본 노드가 40바이트만 차지합니다. 나중에 다양한 연결 리스트를 소개할 예정이며, 해당 기본 노드와 자유 연결 리스트의 기본 노드는 모두 별도로 적용되며 이는 40바이트 메모리 공간에 포함되지 않습니다. 큰 연속 메모리 공간 내의 버퍼 풀. 🎜🎜🎜이 무료 연결 목록
을 사용하면 디스크에서 버퍼 풀
로 페이지를 로드해야 할 때마다 작업을 더 쉽게 처리할 수 있습니다. 프리 링크드 리스트에서 프리 캐시 페이지를 가져와서
캐시 페이지에 해당하는 컨트롤 블록
의 정보(즉, 페이지가 있는 테이블스페이스)를 채워 넣습니다. 위치, 페이지 번호 등)을 연결 리스트에서 캐시 페이지에 해당하는 프리 링크드 리스트
노드를 제거하면 해당 캐시 페이지가 사용되었음을 나타냅니다~🎜🎜🎜해시 처리 캐시 페이지🎜🎜🎜앞서 말했듯이, 특정 페이지의 데이터에 액세스해야 할 때 페이지가 이미 버퍼에 있는 경우 디스크의 페이지를 <code>버퍼 풀
로 로드합니다. 풀, 바로 사용하세요. 그러면 페이지가 버퍼 풀
에 있는지 어떻게 알 수 있을까요?라는 질문이 생깁니다. 버퍼 풀
의 각 캐시 페이지를 순차적으로 순회해야 하나요? 버퍼 풀
에서 너무 많은 캐시 페이지를 탐색하는 것은 힘들지 않나요? 🎜🎜돌아보면 실제로 테이블스페이스 번호 + 페이지 번호
를 기반으로 페이지를 찾습니다. 이는 테이블스페이스 번호 + 페이지 번호
가 키, <code>캐시 페이지
는 해당 값
입니다. 키
를 통해 값는 어떻습니까? ? 하하, 해시 테이블인가봐요~🎜🎜🎜팁: 뭐? 해시 테이블이 무엇인지 모른다고 말하지 마세요. 우리 기사는 해시 테이블에 관한 것이 아닙니다. 어떻게 해야 할지 모른다면, 가서 데이터 구조에 관한 책을 찾아 읽어보세요~ 뭐? 밖에서 책을 읽을 수 없나요? 걱정하지 마시고 기다려주세요~🎜🎜🎜그래서 <code>테이블스페이스 번호 + 페이지 번호
를 키
로, 캐시 페이지
를 키
로 사용하면 됩니다. 값
해시 테이블을 생성합니다. 특정 페이지의 데이터에 접근해야 할 경우 먼저 테이블스페이스 번호 + 페이지 번호
를 기준으로 해당 캐시 페이지가 있는지 확인하세요. 그렇다면 캐시 페이지를 직접 사용하세요. 그렇지 않다면 무료 연결 목록
에서 무료 캐시 페이지를 선택한 다음 디스크에서 해당 페이지를 캐시 위치로 로드하세요. 페이지. 🎜버퍼 풀
에 있는 캐시 페이지의 데이터를 수정하면 디스크의 페이지와 일치하지 않게 됩니다. 이러한 캐시 페이지를 라고도 합니다. code>더티 페이지
(영문명: 더티 페이지
). 물론 가장 간단한 방법은 수정이 발생할 때마다 즉시 디스크의 해당 페이지에 동기화시키는 것이지만, 디스크에 데이터를 자주 쓰면 프로그램 성능에 심각한 영향을 미치게 됩니다. 거북이). 그래서 우리는 캐시페이지를 수정할 때마다 수정사항을 즉시 디스크에 동기화하는 것을 서두르지 않고, 향후 특정 시점에 동기화를 하도록 하므로 이 동기화 시점에 대해서는 나중에 설명하도록 하겠습니다. 이제 걱정하지 마세요~Buffer Pool
中某个缓存页的数据,那它就和磁盘上的页不一致了,这样的缓存页也被称为脏页
(英文名:dirty page
)。当然,最简单的做法就是每发生一次修改就立即同步到磁盘上对应的页上,但是频繁的往磁盘中写数据会严重的影响程序的性能(毕竟磁盘慢的像乌龟一样)。所以每次修改缓存页后,我们并不着急立即把修改同步到磁盘上,而是在未来的某个时间点进行同步,至于这个同步的时间点我们后边会作说明说明的,现在先不用管哈~
但是如果不立即同步到磁盘的话,那之后再同步的时候我们怎么知道Buffer Pool
中哪些页是脏页
,哪些页从来没被修改过呢?总不能把所有的缓存页都同步到磁盘上吧,假如Buffer Pool
被设置的很大,比方说300G
,那一次性同步这么多数据岂不是要慢死!所以,我们不得不再创建一个存储脏页的链表,凡是修改过的缓存页对应的控制块都会作为一个节点加入到一个链表中,因为这个链表节点对应的缓存页都是需要被刷新到磁盘上的,所以也叫flush链表
。链表的构造和free链表
差不多,假设某个时间点Buffer Pool
中的脏页数量为n
,那么对应的flush链表
就长这样:
缓存不够的窘境
Buffer Pool
对应的内存大小毕竟是有限的,如果需要缓存的页占用的内存大小超过了Buffer Pool
大小,也就是free链表
中已经没有多余的空闲缓存页的时候岂不是很尴尬,发生了这样的事儿该咋办?当然是把某些旧的缓存页从Buffer Pool
中移除,然后再把新的页放进来喽~ 那么问题来了,移除哪些缓存页呢?
为了回答这个问题,我们还需要回到我们设立Buffer Pool
的初衷,我们就是想减少和磁盘的IO
交互,最好每次在访问某个页的时候它都已经被缓存到Buffer Pool
中了。假设我们一共访问了n
次页,那么被访问的页已经在缓存中的次数除以n
就是所谓的缓存命中率
,我们的期望就是让缓存命中率
越高越好~ 从这个角度出发,回想一下我们的微信聊天列表,排在前边的都是最近很频繁使用的,排在后边的自然就是最近很少使用的,假如列表能容纳下的联系人有限,你是会把最近很频繁使用的留下还是最近很少使用的留下呢?废话,当然是留下最近很频繁使用的了~
简单的LRU链表
管理Buffer Pool
的缓存页其实也是这个道理,当Buffer Pool
中不再有空闲的缓存页时,就需要淘汰掉部分最近很少使用的缓存页。不过,我们怎么知道哪些缓存页最近频繁使用,哪些最近很少使用呢?呵呵,神奇的链表再一次派上了用场,我们可以再创建一个链表,由于这个链表是为了按照最近最少使用
的原则去淘汰缓存页的,所以这个链表可以被称为LRU链表
(LRU的英文全称:Least Recently Used)。当我们需要访问某个页时,可以这样处理LRU链表
:
如果该页不在Buffer Pool
中,在把该页从磁盘加载到Buffer Pool
中的缓存页时,就把该缓存页对应的控制块
作为节点塞到链表的头部。
如果该页已经缓存在Buffer Pool
中,则直接把该页对应的控制块
移动到LRU链表
的头部。
也就是说:只要我们使用到某个缓存页,就把该缓存页调整到LRU链表
的头部,这样LRU链表
尾部就是最近最少使用的缓存页喽~ 所以当Buffer Pool
中的空闲缓存页使用完时,到LRU链表
的尾部找些缓存页淘汰就OK啦,真简单,啧啧...
划分区域的LRU链表
高兴的太早了,上边的这个简单的LRU链表
버퍼 풀
의 어떤 페이지가 더티 페이지
인지 어떻게 알 수 있나요? 한 번도 동기화되지 않은 페이지가 수정되었나요? 모든 캐시 페이지를 디스크에 동기화할 수는 없습니다. 버퍼 풀
이 300G
와 같이 큰 크기로 설정되어 있으면 동기화가 필요하지 않을까요? 한 번에 너무 많은 데이터가 발생합니까? 천천히 죽어라! 따라서 더티 페이지를 저장하기 위해 또 다른 연결된 목록을 만들어야 합니다. 연결된 목록 노드에 해당하는 캐시 페이지를 새로 고쳐야 하기 때문에 수정된 캐시 페이지에 해당하는 제어 블록이 연결 목록에 노드로 추가됩니다. disk.이므로 flush linked list
라고도 합니다. 연결리스트의 구조는 자유 연결리스트
와 유사하다. 특정 시점의 버퍼 풀
에 있는 더티 페이지의 수가 n이라고 가정하자.
, 해당 플러시 연결 목록
은 다음과 같습니다. 🎜🎜🎜LRU 연결리스트 관리🎜🎜캐시 부족의 딜레마🎜🎜에 해당하는 메모리 크기 Buffer Pool
은 결국 제한되어 있는 경우가 있는데, 캐시해야 하는 페이지가 차지하는 메모리 크기가 Buffer Pool
크기를 초과하면 당황스럽지 않나요? 무료 연결 목록
에 더 이상 무료 캐시 페이지가 없나요? 이런 경우 어떻게 해야 하나요? 물론 버퍼 풀
에서 오래된 캐시 페이지 중 일부를 제거한 후 새로운 페이지를 넣기도 하죠~ 그러면 어떤 캐시 페이지를 제거해야 할까요? 🎜🎜이 질문에 대답하려면 버퍼 풀
을 설정하려는 원래 의도로 돌아가야 합니다. 우리는 단지 디스크와의 IO
상호 작용을 줄이고 싶을 뿐입니다. 페이지에 도달할 때 버퍼 풀
에 캐시되어 있는 특정 항목에 액세스하는 것이 가장 좋습니다. 페이지를 총 n
번 방문했다고 가정하면, 방문한 페이지가 캐시에 있었던 횟수를 n
으로 나눈 값이 소위 입니다. 캐시 적중률
, 우리는 캐시 적중률
을 최대한 높게 만드는 것이 기대됩니다 ~ 이러한 관점에서 WeChat 채팅 목록을 다시 생각해 보면 맨 위에 있는 것이 캐시 적중률
Buffer Pool
의 캐시 페이지 관리는 Buffer Pool에서도 마찬가지입니다.
더 이상 사용 가능한 캐시 페이지가 없으면 최근에 거의 사용되지 않은 일부 캐시 페이지를 제거해야 합니다. 그러나 최근에 어떤 캐시된 페이지가 자주 사용되었는지, 어떤 페이지가 거의 사용되지 않았는지 어떻게 알 수 있습니까? 하하, 마법의 연결 목록이 다시 유용해졌습니다. 이 연결 목록은 최근 사용 횟수에 따라 캐시 페이지를 제거
하는 데 사용되므로 이 연결 목록을 LRU linked list(LRU의 전체 영어 이름: Least Recent Used)입니다. 특정 페이지에 액세스해야 할 때 다음과 같이 LRU 연결 목록
을 처리할 수 있습니다. 🎜버퍼 풀
에 없는 경우 , Buffer Pool
의 캐시 페이지에 디스크가 로드되면 해당 캐시 페이지에 해당하는 컨트롤 블록
이 Linked List의 헤드에 삽입됩니다. 노드. 🎜버퍼 풀
에 캐시된 경우 해당 페이지의 해당 컨트롤 블록
을 LRU 연결 목록으로 직접 이동하세요.
헤더. 🎜LRU 연결 목록
의 헤드로 조정하여 LRU linked list의 tail은 최근에 가장 적게 사용된 캐시 페이지입니다~ 그래서 Buffer Pool
의 free 캐시 페이지를 모두 사용하면 LRU linked의 tail로 이동합니다. list
로 제거할 캐시 페이지를 찾을 수 있습니다. 정말 간단합니다. 와...🎜🎜LRU 연결 목록이 영역으로 나누어져 있습니다.🎜🎜위의 간단한 LRU 연결 목록는 두 가지 당황스러운 상황이 있기 때문에 문제를 찾는 데 오랜 시간이 걸리지 않았습니다. 🎜<ul>
<li>
<p>상황 1: <code>InnoDB
는 겉으로는 사려 깊은 서비스인 read before
(영어 이름: read before
)를 제공합니다. 소위 사전 읽기
는 InnoDB
가 현재 요청을 실행한 후 특정 페이지를 읽을 수 있다고 생각하여 버퍼 풀
에 로드하는 것을 의미합니다. >미리 . 다양한 트리거 방법에 따라 Pre-reading
은 다음 두 가지 유형으로 나눌 수 있습니다. InnoDB
提供了一个看起来比较贴心的服务——预读
(英文名:read ahead
)。所谓预读
,就是InnoDB
认为执行当前的请求可能之后会读取某些页面,就预先把它们加载到Buffer Pool
中。根据触发方式的不同,预读
又可以细分为下边两种:
线性预读
设计InnoDB
的大叔提供了一个系统变量innodb_read_ahead_threshold
,如果顺序访问了某个区(extent
)的页面超过这个系统变量的值,就会触发一次异步
读取下一个区中全部的页面到Buffer Pool
的请求,注意异步
读取意味着从磁盘中加载这些被预读的页面并不会影响到当前工作线程的正常执行。这个innodb_read_ahead_threshold
系统变量的值默认是56
,我们可以在服务器启动时通过启动参数或者服务器运行过程中直接调整该系统变量的值,不过它是一个全局变量,注意使用SET GLOBAL
命令来修改哦。
小贴士: InnoDB是怎么实现异步读取的呢?在Windows或者Linux平台上,可能是直接调用操作系统内核提供的AIO接口,在其它类Unix操作系统中,使用了一种模拟AIO接口的方式来实现异步读取,其实就是让别的线程去读取需要预读的页面。如果你读不懂上边这段话,那也就没必要懂了,和我们主题其实没太多关系,你只需要知道异步读取并不会影响到当前工作线程的正常执行就好了。其实这个过程涉及到操作系统如何处理IO以及多线程的问题,找本操作系统的书看看吧,什么?操作系统的书写的都很难懂?没关系,等我~
随机预读
如果Buffer Pool
中已经缓存了某个区的13个连续的页面,不论这些页面是不是顺序读取的,都会触发一次异步
读取本区中所有其的页面到Buffer Pool
的请求。设计InnoDB
的大叔同时提供了innodb_random_read_ahead
系统变量,它的默认值为OFF
,也就意味着InnoDB
并不会默认开启随机预读的功能,如果我们想开启该功能,可以通过修改启动参数或者直接使用SET GLOBAL
命令把该变量的值设置为ON
。
预读
本来是个好事儿,如果预读到Buffer Pool
中的页成功的被使用到,那就可以极大的提高语句执行的效率。可是如果用不到呢?这些预读的页都会放到LRU
链表的头部,但是如果此时Buffer Pool
的容量不太大而且很多预读的页面都没有用到的话,这就会导致处在LRU链表
尾部的一些缓存页会很快的被淘汰掉,也就是所谓的劣币驱逐良币
,会大大降低缓存命中率。
情况二:有的小伙伴可能会写一些需要扫描全表的查询语句(比如没有建立合适的索引或者压根儿没有WHERE子句的查询)。
扫描全表意味着什么?意味着将访问到该表所在的所有页!假设这个表中记录非常多的话,那该表会占用特别多的页
,当需要访问这些页时,会把它们统统都加载到Buffer Pool
中,这也就意味着吧唧一下,Buffer Pool
中的所有页都被换了一次血,其他查询语句在执行时又得执行一次从磁盘加载到Buffer Pool
的操作。而这种全表扫描的语句执行的频率也不高,每次执行都要把Buffer Pool
中的缓存页换一次血,这严重的影响到其他查询对 Buffer Pool
的使用,从而大大降低了缓存命中率。
总结一下上边说的可能降低Buffer Pool
的两种情况:
加载到Buffer Pool
中的页不一定被用到。
如果非常多的使用频率偏低的页被同时加载到Buffer Pool
时,可能会把那些使用频率非常高的页从Buffer Pool
中淘汰掉。
因为有这两种情况的存在,所以设计InnoDB
的大叔把这个LRU链表
按照一定比例分成两截,分别是:
一部分存储使用频率非常高的缓存页,所以这一部分链表也叫做热数据
,或者称young区域
。
另一部分存储使用频率不是很高的缓存页,所以这一部分链表也叫做冷数据
,或者称old区域
InnoDB
를 설계한 삼촌이 제공한 시스템 변수innodb_read_ahead_threshold
, 특정 영역(extent
)에서 순차적으로 액세스되는 페이지가 이 시스템 변수의 값을 초과하는 경우 비동기
읽기가 수행됩니다. Triggered 해당 영역의 모든 페이지는 Buffer Pool
에 요청됩니다. 비동기
읽기는 디스크에서 이러한 미리 읽기 페이지를 로드해도 현재 작업 스레드에 영향을 미치지 않는다는 것을 의미합니다. . 이 innodb_read_ahead_threshold
시스템 변수의 기본값은 56
입니다. 서버가 시작될 때 또는 서버 실행 프로세스 중에 시작 매개변수를 통해 이 시스템 변수의 값을 직접 조정할 수 있습니다. 전역 변수이므로 SET GLOBAL
명령을 사용하여 수정하세요. 🎜🎜팁: InnoDB는 비동기 읽기를 어떻게 구현하나요? Windows나 Linux 플랫폼에서는 운영 체제 커널에서 제공하는 AIO 인터페이스를 직접 호출하는 것이 가능할 수 있습니다. 다른 Unix 계열 운영 체제에서는 실제로 비동기 읽기를 달성하기 위해 AIO 인터페이스를 시뮬레이션하는 방법이 사용됩니다. 다른 스레드가 읽을 수 있도록 하려면 읽어야 할 페이지를 미리 가져옵니다. 위 단락을 이해하지 못한다면 이해할 필요가 없습니다. 우리 주제와는 아무 관련이 없습니다. 비동기 읽기가 현재 작업 스레드의 정상적인 실행에 영향을 주지 않는다는 것만 알면 됩니다. 실제로 이 프로세스에는 운영 체제가 IO 및 멀티스레딩 문제를 처리하는 방법이 포함됩니다. 운영 체제에 대한 책을 찾아 읽어보세요. 운영체제의 작성이 이해하기 어려운가요? 괜찮아 기다려봐~🎜🎜🎜🎜Random pre-reading🎜🎜페이지 읽기 여부와 상관없이 특정 영역의 연속된 13페이지가
Buffer Pool
에 캐시되어 있다면 순차적으로 비동기
요청을 트리거하여 이 영역의 모든 페이지를 버퍼 풀
로 읽습니다. InnoDB
를 설계한 삼촌은 innodb_random_read_ahead
시스템 변수도 제공했습니다. 기본값은 OFF
입니다. 이는 InnoDB
를 의미합니다. 무작위 미리 읽기 기능은 기본적으로 활성화되어 있지 않습니다. 이 기능을 활성화하려면 시작 매개변수를 수정하거나 SET GLOBAL
을 직접 사용하여 이 변수의 값을 ON으로 설정할 수 있습니다. 코드> 명령>. 🎜🎜🎜🎜<code>미리 읽기
는 원래 좋은 것입니다. 미리 읽기 버퍼 풀
에 있는 페이지를 성공적으로 사용하면 명령문 실행이 크게 향상될 수 있습니다. 능률. 하지만 사용되지 않는다면 어떨까요? 이러한 미리 읽기 페이지는 LRU
연결 목록의 선두에 배치되지만, 이때 버퍼 풀
의 용량이 너무 크지 않고 미리 읽기가 많은 경우 페이지가 사용되지 않으면 LRU 연결 목록
끝에 있는 일부 캐시 페이지가 빠르게 제거됩니다. 이는 소위 나쁜 코인이 좋은 코인을 몰아낸다
입니다. > 캐시 적중률이 크게 감소합니다. 🎜🎜🎜🎜시나리오 2: 일부 친구는 전체 테이블을 스캔해야 하는 일부 쿼리 문을 작성할 수 있습니다(예: 적절한 인덱스를 생성하지 않거나 WHERE 절이 전혀 없는 쿼리). 🎜🎜테이블 전체를 스캔한다는 것은 무엇을 의미하나요? 이는 테이블이 있는 모든 페이지에 액세스할 수 있음을 의미합니다! 이 테이블에 매우 많은 레코드가 있다고 가정하면 테이블은 특히 많은 수의 페이지
를 차지하게 됩니다. 이러한 페이지에 액세스해야 하면 모두 버퍼 풀. 이는 <code>버퍼 풀
의 모든 페이지가 한 번 교체되었으며 다른 쿼리 문이 교체될 때 디스크에서 버퍼 풀
로 로드되어야 함을 의미합니다. 실행된 코드> 작업입니다. 이런 종류의 전체 테이블 스캔 문은 실행될 때마다 버퍼 풀
의 캐시 페이지를 교체해야 하므로 실행 빈도가 높지 않습니다. 이는 Buffer를 사용하면 캐시 적중률이 크게 감소합니다. 🎜🎜🎜🎜 위에서 언급한 버퍼 풀
을 줄일 수 있는 두 가지 상황을 요약해 보세요. 🎜🎜🎜🎜버퍼 풀
에 로드된 페이지가 반드시 사용되지 않을 수도 있습니다. 🎜🎜🎜🎜사용 빈도가 낮은 페이지가 버퍼 풀
에 동시에 로드되면 사용 빈도가 매우 높은 페이지는 버퍼 풀
에서 제거될 수 있습니다. 코드> 제거합니다. 🎜🎜🎜🎜이 두 가지 상황이 존재하기 때문에 InnoDB
를 설계한 삼촌은 이 LRU 연결 목록
을 일정한 비율에 따라 두 부분으로 나누었습니다. 🎜🎜🎜🎜 캐시 페이지의 일부는 매우 자주 사용되는 캐시 페이지를 저장하므로 연결 목록의 이 부분을 핫 데이터
또는 젊은 영역
이라고도 합니다. 🎜🎜🎜🎜다른 부분은 자주 사용하지 않는 캐시 페이지를 저장하는 부분이므로 링크드 리스트의 이 부분을 콜드 데이터
또는 old 영역
이라고도 합니다. 🎜🎜🎜🎜모든 사람의 이해를 돕기 위해 개념도를 단순화했습니다. 🎜
大家要特别注意一个事儿:我们是按照某个比例将LRU链表分成两半的,不是某些节点固定是young区域的,某些节点固定是old区域的,随着程序的运行,某个节点所属的区域也可能发生变化。那这个划分成两截的比例怎么确定呢?对于InnoDB
存储引擎来说,我们可以通过查看系统变量innodb_old_blocks_pct
的值来确定old
区域在LRU链表
中所占的比例,比方说这样:
mysql> SHOW VARIABLES LIKE 'innodb_old_blocks_pct'; +-----------------------+-------+ | Variable_name | Value | +-----------------------+-------+ | innodb_old_blocks_pct | 37 | +-----------------------+-------+ 1 row in set (0.01 sec)
从结果可以看出来,默认情况下,old
区域在LRU链表
中所占的比例是37%
,也就是说old
区域大约占LRU链表
的3/8
。这个比例我们是可以设置的,我们可以在启动时修改innodb_old_blocks_pct
参数来控制old
区域在LRU链表
中所占的比例,比方说这样修改配置文件:
[server] innodb_old_blocks_pct = 40
这样我们在启动服务器后,old
区域占LRU链表
的比例就是40%
。当然,如果在服务器运行期间,我们也可以修改这个系统变量的值,不过需要注意的是,这个系统变量属于全局变量
,一经修改,会对所有客户端生效,所以我们只能这样修改:
SET GLOBAL innodb_old_blocks_pct = 40;
有了这个被划分成young
和old
区域的LRU
链表之后,设计InnoDB
的大叔就可以针对我们上边提到的两种可能降低缓存命中率的情况进行优化了:
针对预读的页面可能不进行后续访问情况的优化
设计InnoDB
的大叔规定,当磁盘上的某个页面在初次加载到Buffer Pool中的某个缓存页时,该缓存页对应的控制块会被放到old区域的头部。这样针对预读到Buffer Pool
却不进行后续访问的页面就会被逐渐从old
区域逐出,而不会影响young
区域中被使用比较频繁的缓存页。
针对全表扫描时,短时间内访问大量使用频率非常低的页面情况的优化
在进行全表扫描时,虽然首次被加载到Buffer Pool
的页被放到了old
区域的头部,但是后续会被马上访问到,每次进行访问的时候又会把该页放到young
区域的头部,这样仍然会把那些使用频率比较高的页面给顶下去。有同学会想:可不可以在第一次访问该页面时不将其从old
区域移动到young
区域的头部,后续访问时再将其移动到young
区域的头部。回答是:行不通!因为设计InnoDB
的大叔规定每次去页面中读取一条记录时,都算是访问一次页面,而一个页面中可能会包含很多条记录,也就是说读取完某个页面的记录就相当于访问了这个页面好多次。
咋办?全表扫描有一个特点,那就是它的执行频率非常低,谁也不会没事儿老在那写全表扫描的语句玩,而且在执行全表扫描的过程中,即使某个页面中有很多条记录,也就是去多次访问这个页面所花费的时间也是非常少的。所以我们只需要规定,在对某个处在old
区域的缓存页进行第一次访问时就在它对应的控制块中记录下来这个访问时间,如果后续的访问时间与第一次访问的时间在某个时间间隔内,那么该页面就不会被从old区域移动到young区域的头部,否则将它移动到young区域的头部。上述的这个间隔时间是由系统变量innodb_old_blocks_time
控制的,你看:
mysql> SHOW VARIABLES LIKE 'innodb_old_blocks_time'; +------------------------+-------+ | Variable_name | Value | +------------------------+-------+ | innodb_old_blocks_time | 1000 | +------------------------+-------+ 1 row in set (0.01 sec)
这个innodb_old_blocks_time
的默认值是1000
,它的单位是毫秒,也就意味着对于从磁盘上被加载到LRU
链表的old
区域的某个页来说,如果第一次和最后一次访问该页面的时间间隔小于1s
(很明显在一次全表扫描的过程中,多次访问一个页面中的时间不会超过1s
),那么该页是不会被加入到young
区域的~ 当然,像innodb_old_blocks_pct
一样,我们也可以在服务器启动或运行时设置innodb_old_blocks_time
的值,这里就不赘述了,你自己试试吧~ 这里需要注意的是,如果我们把innodb_old_blocks_time
的值设置为0
,那么每次我们访问一个页面时就会把该页面放到young
区域的头部。
요약하자면 LRU
연결 리스트가 young
영역과 old
영역 두 부분으로 나뉘고, 가 추가되었기 때문입니다. 시스템 변수 innodb_old_blocks_time
은 미리 읽기 메커니즘과 전체 테이블 스캔으로 인해 발생하는 캐시 적중률 감소 문제를 억제했습니다. 사용되지 않은 미리 읽기 페이지와 전체 테이블 스캔 페이지는 old 영역은 <code>young
영역의 캐시된 페이지에 영향을 주지 않습니다. LRU
链表划分为young
和old
区域这两个部分,又添加了innodb_old_blocks_time
这个系统变量,才使得预读机制和全表扫描造成的缓存命中率降低的问题得到了遏制,因为用不到的预读页面以及全表扫描的页面都只会被放到old
区域,而不影响young
区域中的缓存页。
更进一步优化LRU链表
LRU链表
这就说完了么?没有,早着呢~ 对于young
区域的缓存页来说,我们每次访问一个缓存页就要把它移动到LRU链表
的头部,这样开销是不是太大啦,毕竟在young
区域的缓存页都是热点数据,也就是可能被经常访问的,这样频繁的对LRU链表
进行节点移动操作是不是不太好啊?是的,为了解决这个问题其实我们还可以提出一些优化策略,比如只有被访问的缓存页位于young
区域的1/4
的后边,才会被移动到LRU链表
头部,这样就可以降低调整LRU链表
的频率,从而提升性能(也就是说如果某个缓存页对应的节点在young
区域的1/4
中,再次访问该缓存页时也不会将其移动到LRU
链表头部)。
小贴士: 我们之前介绍随机预读的时候曾说,如果Buffer Pool中有某个区的13个连续页面就会触发随机预读,这其实是不严谨的(不幸的是MySQL文档就是这么说的[摊手]),其实还要求这13个页面是非常热的页面,所谓的非常热,指的是这些页面在整个young区域的头1/4处。
还有没有什么别的针对LRU链表
的优化措施呢?当然有啊,你要是好好学,写篇论文,写本书都不是问题,可是这毕竟是一个介绍MySQL
基础知识的文章,再说多了篇幅就受不了了,也影响大家的阅读体验,所以适可而止,想了解更多的优化知识,自己去看源码或者更多关于LRU
链表的知识喽~ 但是不论怎么优化,千万别忘了我们的初心:尽量高效的提高 Buffer Pool 的缓存命中率。
为了更好的管理Buffer Pool
中的缓存页,除了我们上边提到的一些措施,设计InnoDB
的大叔们还引进了其他的一些链表
,比如unzip LRU链表
用于管理解压页,zip clean链表
用于管理没有被解压的压缩页,zip free数组
中每一个元素都代表一个链表,它们组成所谓的伙伴系统
来为压缩页提供内存空间等等,反正是为了更好的管理这个Buffer Pool
引入了各种链表或其他数据结构,具体的使用方式就不啰嗦了,大家有兴趣深究的再去找些更深的书或者直接看源代码吧,也可以直接来找我哈~
小贴士: 我们压根儿没有深入唠叨过InnoDB中的压缩页,对上边的这些链表也只是为了完整性顺便提一下,如果你看不懂千万不要抑郁,因为我压根儿就没打算向大家介绍它们。
后台有专门的线程每隔一段时间负责把脏页刷新到磁盘,这样可以不影响用户线程处理正常的请求。主要有两种刷新路径:
从LRU链表
的冷数据中刷新一部分页面到磁盘。
后台线程会定时从LRU链表
尾部开始扫描一些页面,扫描的页面数量可以通过系统变量innodb_lru_scan_depth
来指定,如果从里边儿发现脏页,会把它们刷新到磁盘。这种刷新页面的方式被称之为BUF_FLUSH_LRU
。
从flush链表
中刷新一部分页面到磁盘。
后台线程也会定时从flush链表
中刷新一部分页面到磁盘,刷新的速率取决于当时系统是不是很繁忙。这种刷新页面的方式被称之为BUF_FLUSH_LIST
。
有时候后台线程刷新脏页的进度比较慢,导致用户线程在准备加载一个磁盘页到Buffer Pool
时没有可用的缓存页,这时就会尝试看看LRU链表
尾部有没有可以直接释放掉的未修改页面,如果没有的话会不得不将LRU链表
尾部的一个脏页同步刷新到磁盘(和磁盘交互是很慢的,这会降低处理用户请求的速度)。这种刷新单个页面到磁盘中的刷新方式被称之为BUF_FLUSH_SINGLE_PAGE
LRU 연결 목록
이게 다인가요? 아뇨 빠르네요~ young
영역의 캐시 페이지의 경우 캐시 페이지에 접근할 때마다 LRU 연결 리스트
의 선두로 옮겨야 하므로 오버헤드는 그리 크지 않습니다. 결국 young
영역의 캐시 페이지는 핫 데이터입니다. 즉, 연결된 LRU에서 이러한 빈번한 노드 이동 작업이 발생할 수 있습니다. list
는 꼭 필요한 것 아닌가요? 예, 이 문제를 해결하기 위해 실제로 몇 가지 최적화 전략을 제안할 수 있습니다. 예를 들어 young
영역에서 1/4
뒤에 위치한 액세스된 캐시 페이지만 가능합니다. 캐시된 LRU 연결 목록
의 헤드로 이동하여 LRU 연결 목록
을 조정하는 빈도를 줄여 성능을 향상할 수 있습니다(즉, 노드의 경우). 해당 캐시 페이지가 에 있는 Young
영역의 1/4
에 해당 캐시 페이지에 다시 접근할 때 의 선두로 이동하지 않습니다. >LRU
연결 목록). 🎜🎜Tips: 이전에 무작위 사전 읽기를 도입했을 때 버퍼 풀의 특정 영역에 13개의 연속 페이지가 있으면 무작위 사전 읽기가 실행된다고 말했습니다. 이는 실제로 엄격하지는 않습니다(아쉽게도). 이는 MySQL 문서에 나와 있는 내용입니다. 실제로 이 13페이지는 매우 핫한 페이지여야 합니다. 소위 매우 핫한 페이지는 전체 젊은 영역의 처음 1/4에 해당하는 페이지를 의미합니다. 🎜🎜
LRU 연결 목록
에 대한 다른 최적화 방법이 있나요? 물론 있습니다. 열심히 공부하면 논문이나 책을 쓰는 것도 문제가 되지 않을 것입니다. 하지만 결국 이 글은 MySQL
에 대한 기초 지식을 소개하는 글입니다. 너무 길면 참을 수 없을 것이고 모든 사람의 독서 경험에 영향을 미칠 것이므로 충분합니다. 더 많은 최적화 지식을 알고 싶다면 직접 소스 코드로 이동하거나 LRU
연결 목록에 대해 자세히 알아보세요. ~ 하지만 어떻게 최적화하든 우리의 원래 의도를 잊지 마세요. 버퍼 풀의 캐시 적중률을 최대한 효율적으로 향상시키도록 노력하세요. 🎜버퍼 풀
의 캐시 페이지를 더 잘 관리하려면 위에서 언급한 몇 가지 조치 외에도 InnoDB
를 설계하세요. code> 삼촌들은 압축이 풀린 페이지 관리를 위한 unzip LRU 연결 목록
, 관리를 위한 zip clean 연결 목록
과 같은 다른 연결 목록
도 도입했습니다. 압축이 풀린 페이지의 경우 zip free 배열
의 각 요소는 소위 파트너 시스템
을 형성하여 압축된 페이지에 메모리 공간을 제공합니다. 어쨌든, 이것은 버퍼 풀
의 더 나은 관리를 위해 다양한 연결 목록이나 기타 데이터 구조를 소개합니다. 자세한 사용법에 관심이 있다면 몇 가지를 찾아보세요. 자세한 내용은 책을 읽어보시거나 직접 소스코드를 읽어보셔도 좋습니다. 저한테 직접 오셔도 됩니다~🎜🎜Tips: InnoDB의 압축 페이지에 대해서는 전혀 심도 깊게 다루지 않았으며, 위의 링크 목록은 다음과 같습니다. 완전함을 위해 언급한 것뿐입니다. 이해가 안 되더라도 실망하지 마세요. 저는 전혀 소개할 생각이 없습니다. 🎜
LRU 연결 목록
의 콜드 데이터에서 페이지의 일부를 디스크로 새로 고칩니다. 🎜🎜백그라운드 스레드는 LRU 연결 목록
의 끝부터 시작하여 주기적으로 일부 페이지를 스캔합니다. 스캔된 페이지 수는 시스템 변수 innodb_lru_scan_length
를 통해 지정할 수 있습니다. 내부에서 더티 페이지가 발견되면 해당 페이지를 디스크로 플러시합니다. 이 페이지를 새로 고치는 방법을 BUF_FLUSH_LRU
라고 합니다. 🎜플러시 연결 목록
의 일부 페이지를 디스크로 새로 고칩니다. 🎜🎜백그라운드 스레드는 flush linked list
의 일부 페이지를 디스크에 주기적으로 새로 고치기도 합니다. 새로 고침 빈도는 해당 시점에 시스템 사용량이 많은지에 따라 달라집니다. 이 페이지를 새로 고치는 방법을 BUF_FLUSH_LIST
라고 합니다. 🎜버퍼 풀
에 로드하려고 준비할 때 사용자 스레드에 사용 가능한 캐시 페이지가 없게 되는 경우가 있습니다. LRU 연결 목록
끝에 직접 해제할 수 있는 수정되지 않은 페이지가 있는지 확인하려고 시도합니다. 그렇지 않으면 끝에 있는 더티 페이지를 동기적으로 새로 고쳐야 합니다. >LRU 연결 목록
을 디스크에 연결합니다(디스크와의 상호 작용이 매우 느려서 사용자 요청 처리 속도가 느려집니다). 단일 페이지를 디스크에 플러시하는 이 방법을 BUF_FLUSH_SINGLE_PAGE
라고 합니다. 🎜当然,有时候系统特别繁忙时,也可能出现用户线程批量的从flush链表
中刷新脏页的情况,很显然在处理用户请求过程中去刷新脏页是一种严重降低处理速度的行为(毕竟磁盘的速度慢的要死),这属于一种迫不得已的情况,不过这得放在后边唠叨redo
日志的checkpoint
时说了。
我们上边说过,Buffer Pool
本质是InnoDB
向操作系统申请的一块连续的内存空间,在多线程环境下,访问Buffer Pool
中的各种链表都需要加锁处理啥的,在Buffer Pool
特别大而且多线程并发访问特别高的情况下,单一的Buffer Pool
可能会影响请求的处理速度。所以在Buffer Pool
特别大的时候,我们可以把它们拆分成若干个小的Buffer Pool
,每个Buffer Pool
都称为一个实例
,它们都是独立的,独立的去申请内存空间,独立的管理各种链表,独立的吧啦吧啦,所以在多线程并发访问时并不会相互影响,从而提高并发处理能力。我们可以在服务器启动的时候通过设置innodb_buffer_pool_instances
的值来修改Buffer Pool
实例的个数,比方说这样:
[server] innodb_buffer_pool_instances = 2
这样就表明我们要创建2个Buffer Pool
实例,示意图就是这样:
小贴士: 为了简便,我只把各个链表的基节点画出来了,大家应该心里清楚这些链表的节点其实就是每个缓存页对应的控制块!
那每个Buffer Pool
实例实际占多少内存空间呢?其实使用这个公式算出来的:
innodb_buffer_pool_size/innodb_buffer_pool_instances
也就是总共的大小除以实例的个数,结果就是每个Buffer Pool
实例占用的大小。
不过也不是说Buffer Pool
实例创建的越多越好,分别管理各个Buffer Pool
也是需要性能开销的,设计InnoDB
的大叔们规定:当innodb_buffer_pool_size的值小于1G的时候设置多个实例是无效的,InnoDB会默认把innodb_buffer_pool_instances 的值修改为1。而我们鼓励在Buffer Pool
大于或等于1G的时候设置多个Buffer Pool
实例。
在MySQL 5.7.5
之前,Buffer Pool
的大小只能在服务器启动时通过配置innodb_buffer_pool_size
启动参数来调整大小,在服务器运行过程中是不允许调整该值的。不过设计MySQL
的大叔在5.7.5
以及之后的版本中支持了在服务器运行过程中调整Buffer Pool
大小的功能,但是有一个问题,就是每次当我们要重新调整Buffer Pool
大小时,都需要重新向操作系统申请一块连续的内存空间,然后将旧的Buffer Pool
中的内容复制到这一块新空间,这是极其耗时的。所以设计MySQL
的大叔们决定不再一次性为某个Buffer Pool
实例向操作系统申请一大片连续的内存空间,而是以一个所谓的chunk
为单位向操作系统申请空间。也就是说一个Buffer Pool
实例其实是由若干个chunk
组成的,一个chunk
就代表一片连续的内存空间,里边儿包含了若干缓存页与其对应的控制块,画个图表示就是这样:
上图代表的Buffer Pool
就是由2个实例组成的,每个实例中又包含2个chunk
。
正是因为发明了这个chunk
的概念,我们在服务器运行期间调整Buffer Pool
的大小时就是以chunk
为单位增加或者删除内存空间,而不需要重新向操作系统申请一片大的内存,然后进行缓存页的复制。这个所谓的chunk
的大小是我们在启动操作MySQL
服务器时通过innodb_buffer_pool_chunk_size
启动参数指定的,它的默认值是134217728
,也就是128M
。不过需要注意的是,innodb_buffer_pool_chunk_size的值只能在服务器启动时指定,在服务器运行过程中是不可以修改的。
小贴士: 为什么不允许在服务器运行过程中修改innodb_buffer_pool_chunk_size的值?还不是因为innodb_buffer_pool_chunk_size的值代表InnoDB向操作系统申请的一片连续的内存空间的大小,如果你在服务器运行过程中修改了该值,就意味着要重新向操作系统申请连续的内存空间并且将原先的缓存页和它们对应的控制块复制到这个新的内存空间中,这是十分耗时的操作! 另外,这个innodb_buffer_pool_chunk_size的值并不包含缓存页对应的控制块的内存空间大小,所以实际上InnoDB向操作系统申请连续内存空间时,每个chunk的大小要比innodb_buffer_pool_chunk_size的值大一些,约5%。
innodb_buffer_pool_size
必须是innodb_buffer_pool_chunk_size × innodb_buffer_pool_instances
的倍数(这主要是想保证每一个Buffer Pool
实例中包含的chunk
数量相同)。
假设我们指定的innodb_buffer_pool_chunk_size
的值是128M
,innodb_buffer_pool_instances
的值是16
,那么这两个值的乘积就是2G
,也就是说innodb_buffer_pool_size
的值必须是2G
或者2G
的整数倍。比方说我们在启动MySQL
服务器是这样指定启动参数的:
mysqld --innodb-buffer-pool-size=8G --innodb-buffer-pool-instances=16
默认的innodb_buffer_pool_chunk_size
值是128M
,指定的innodb_buffer_pool_instances
的值是16
,所以innodb_buffer_pool_size
的值必须是2G
或者2G
的整数倍,上边例子中指定的innodb_buffer_pool_size
的值是8G
,符合规定,所以在服务器启动完成之后我们查看一下该变量的值就是我们指定的8G
(8589934592字节):
mysql> show variables like 'innodb_buffer_pool_size'; +-------------------------+------------+ | Variable_name | Value | +-------------------------+------------+ | innodb_buffer_pool_size | 8589934592 | +-------------------------+------------+ 1 row in set (0.00 sec)
如果我们指定的innodb_buffer_pool_size
大于2G
并且不是2G
的整数倍,那么服务器会自动的把innodb_buffer_pool_size
的值调整为2G
的整数倍,比方说我们在启动服务器时指定的innodb_buffer_pool_size
的值是9G
:
mysqld --innodb-buffer-pool-size=9G --innodb-buffer-pool-instances=16
那么服务器会自动把innodb_buffer_pool_size
的值调整为10G
(10737418240字节),不信你看:
mysql> show variables like 'innodb_buffer_pool_size'; +-------------------------+-------------+ | Variable_name | Value | +-------------------------+-------------+ | innodb_buffer_pool_size | 10737418240 | +-------------------------+-------------+ 1 row in set (0.01 sec)
如果在服务器启动时,innodb_buffer_pool_chunk_size × innodb_buffer_pool_instances
的值已经大于innodb_buffer_pool_size
的值,那么innodb_buffer_pool_chunk_size
的值会被服务器自动设置为innodb_buffer_pool_size/innodb_buffer_pool_instances
的值。
比方说我们在启动服务器时指定的innodb_buffer_pool_size
的值为2G
,innodb_buffer_pool_instances
的值为16,innodb_buffer_pool_chunk_size
的值为256M
:
mysqld --innodb-buffer-pool-size=2G --innodb-buffer-pool-instances=16 --innodb-buffer-pool-chunk-size=256M
由于256M × 16 = 4G
,而4G > 2G
,所以innodb_buffer_pool_chunk_size
值会被服务器改写为innodb_buffer_pool_size/innodb_buffer_pool_instances
的值,也就是:2G/16 = 128M
(134217728字节),不信你看:
mysql> show variables like 'innodb_buffer_pool_size'; +-------------------------+------------+ | Variable_name | Value | +-------------------------+------------+ | innodb_buffer_pool_size | 2147483648 | +-------------------------+------------+ 1 row in set (0.01 sec) mysql> show variables like 'innodb_buffer_pool_chunk_size'; +-------------------------------+-----------+ | Variable_name | Value | +-------------------------------+-----------+ | innodb_buffer_pool_chunk_size | 134217728 | +-------------------------------+-----------+ 1 row in set (0.00 sec)
Buffer Pool
的缓存页除了用来缓存磁盘上的页面以外,还可以存储锁信息、自适应哈希索引等信息,这些内容等我们之后遇到了再详细讨论哈~
设计MySQL
的大叔贴心的给我们提供了SHOW ENGINE INNODB STATUS
语句来查看关于InnoDB
存储引擎运行过程中的一些状态信息,其中就包括Buffer Pool
的一些信息,我们看一下(为了突出重点,我们只把输出中关于Buffer Pool
的部分提取了出来):
mysql> SHOW ENGINE INNODB STATUS\G (...省略前边的许多状态) ---------------------- BUFFER POOL AND MEMORY ---------------------- Total memory allocated 13218349056; Dictionary memory allocated 4014231 Buffer pool size 786432 Free buffers 8174 Database pages 710576 Old database pages 262143 Modified db pages 124941 Pending reads 0 Pending writes: LRU 0, flush list 0, single page 0 Pages made young 6195930012, not young 78247510485 108.18 youngs/s, 226.15 non-youngs/s Pages read 2748866728, created 29217873, written 4845680877 160.77 reads/s, 3.80 creates/s, 190.16 writes/s Buffer pool hit rate 956 / 1000, young-making rate 30 / 1000 not 605 / 1000 Pages read ahead 0.00/s, evicted without access 0.00/s, Random read ahead 0.00/s LRU len: 710576, unzip_LRU len: 118 I/O sum[134264]:cur[144], unzip sum[16]:cur[0] -------------- (...省略后边的许多状态) mysql>
我们来详细看一下这里边的每个值都代表什么意思:
Total memory allocated
:代表Buffer Pool
向操作系统申请的连续内存空间大小,包括全部控制块、缓存页、以及碎片的大小。
Dictionary memory allocated
:为数据字典信息分配的内存空间大小,注意这个内存空间和Buffer Pool
没啥关系,不包括在Total memory allocated
中。
Buffer pool size
:代表该Buffer Pool
可以容纳多少缓存页
,注意,单位是页
!
Free buffers
:代表当前Buffer Pool
还有多少空闲缓存页,也就是free链表
中还有多少个节点。
데이터베이스 페이지
: young
및 old
두 영역을 포함하여 LRU
연결 목록의 페이지 수를 나타냅니다. 코드> 노드 수. Database pages
:代表LRU
链表中的页的数量,包含young
和old
两个区域的节点数量。
Old database pages
:代表LRU
链表old
区域的节点数量。
Modified db pages
:代表脏页数量,也就是flush链表
中节点的数量。
Pending reads
:正在等待从磁盘上加载到Buffer Pool
中的页面数量。
当准备从磁盘中加载某个页面时,会先为这个页面在Buffer Pool
中分配一个缓存页以及它对应的控制块,然后把这个控制块添加到LRU
的old
区域的头部,但是这个时候真正的磁盘页并没有被加载进来,Pending reads
的值会跟着加1。
Pending writes LRU
:即将从LRU
链表中刷新到磁盘中的页面数量。
Pending writes flush list
:即将从flush
链表中刷新到磁盘中的页面数量。
Pending writes single page
:即将以单个页面的形式刷新到磁盘中的页面数量。
Pages made young
:代表LRU
链表中曾经从old
区域移动到young
区域头部的节点数量。
这里需要注意,一个节点每次只有从old
区域移动到young
区域头部时才会将Pages made young
的值加1,也就是说如果该节点本来就在young
区域,由于它符合在young
区域1/4后边的要求,下一次访问这个页面时也会将它移动到young
区域头部,但这个过程并不会导致Pages made young
的值加1。
Page made not young
:在将innodb_old_blocks_time
设置的值大于0时,首次访问或者后续访问某个处在old
区域的节点时由于不符合时间间隔的限制而不能将其移动到young
区域头部时,Page made not young
的值会加1。
这里需要注意,对于处在young
区域的节点,如果由于它在young
区域的1/4处而导致它没有被移动到young
区域头部,这样的访问并不会将Page made not young
的值加1。
youngs/s
:代表每秒从old
区域被移动到young
区域头部的节点数量。
non-youngs/s
:代表每秒由于不满足时间限制而不能从old
区域移动到young
区域头部的节点数量。
Pages read
、created
、written
:代表读取,创建,写入了多少页。后边跟着读取、创建、写入的速率。
Buffer pool hit rate
:表示在过去某段时间,平均访问1000次页面,有多少次该页面已经被缓存到Buffer Pool
了。
young-making rate
:表示在过去某段时间,平均访问1000次页面,有多少次访问使页面移动到young
区域的头部了。
需要大家注意的一点是,这里统计的将页面移动到young
区域的头部次数不仅仅包含从old
区域移动到young
区域头部的次数,还包括从young
区域移动到young
区域头部的次数(访问某个young
区域的节点,只要该节点在young
区域的1/4处往后,就会把它移动到young
区域的头部)。
not (young-making rate)
:表示在过去某段时间,平均访问1000次页面,有多少次访问没有使页面移动到young
区域的头部。
需要大家注意的一点是,这里统计的没有将页面移动到young
区域的头部次数不仅仅包含因为设置了innodb_old_blocks_time
系统变量而导致访问了old
区域中的节点但没把它们移动到young
区域的次数,还包含因为该节点在young
区域的前1/4处而没有被移动到young
区域头部的次数。
LRU len
:代表LRU链表
中节点的数量。
unzip_LRU
:代表unzip_LRU链表
中节点的数量(由于我们没有具体唠叨过这个链表,现在可以忽略它的值)。
I/O sum
:最近50s读取磁盘页的总数。
I/O cur
:现在正在读取的磁盘页数量。
I/O unzip sum
:最近50s解压的页面数量。
I/O unzip cur
이전 데이터베이스 페이지
: LRU
연결 목록의 old
영역에 있는 노드 수를 나타냅니다. 🎜🎜🎜🎜수정된 db 페이지
: 더티 페이지 수, 즉 플러시 연결 목록
의 노드 수를 나타냅니다. 🎜🎜🎜🎜대기 중인 읽기
: 디스크에서 버퍼 풀
로 로드되기를 기다리는 페이지 수입니다. 🎜🎜디스크에서 페이지 로드를 준비할 때 먼저 캐시 페이지와 해당 페이지의 버퍼 풀
에 해당 제어 블록을 할당한 다음 이 제어 블록을 헤더에 추가합니다. LRU
의 이전
영역이지만 실제 디스크 페이지는 현재 로드되지 않았으며 Pending reads
값이 1씩 증가합니다. . 🎜🎜🎜🎜Pending writes LRU
: LRU
연결 목록에서 디스크로 플러시될 페이지 수입니다. 🎜🎜🎜🎜Pending writes 플러시 목록
: flush
연결 목록에서 디스크로 플러시될 페이지 수입니다. 🎜🎜🎜🎜단일 페이지 쓰기 보류
: 단일 페이지로 디스크에 플러시될 페이지 수입니다. 🎜🎜🎜🎜Pages made young
: LRU
연결 목록이 old
영역에서 young의 헤드로 이동했음을 나타냅니다.
영역 노드 수. 🎜🎜여기서 주목해야 할 점은 노드가 old
영역에서 youngPages made young
값을 갖게 된다는 점입니다. /code> 영역에 1을 추가합니다. 즉, 노드가 이미 young
영역에 있는 경우 young
의 1/4 뒤에 있어야 하는 요구 사항을 충족하기 때문입니다. > 영역이면 다음번에 이 페이지를 방문하실 때도 young
영역의 헤드로 이동시키시게 되지만, 이 과정으로 인해 Pages made young
의 가치가 발생하지는 않습니다. > 1씩 증가합니다. 🎜🎜🎜🎜젊지 않은 페이지
: innodb_old_blocks_time
값이 0보다 크게 설정된 경우 위치에 대한 첫 번째 방문 또는 후속 방문은 old 한 지역의 노드가 시간 간격 제한을 충족하지 않아 <code>young
지역의 선두로 이동할 수 없는 경우 Page made not young
의 값 1씩 증가하게 됩니다. 🎜🎜여기서 주목해야 할 점은 young
영역에 있는 노드의 경우 young
의 1/4에 있기 때문에 young으로 이동되지 않는 경우입니다.
지역 헤더에 액세스하더라도 Page made not young
의 값이 1씩 증가하지 않습니다. 🎜🎜🎜🎜youngs/s
: 초당 old
영역에서 young
영역의 선두로 이동한 노드 수를 나타냅니다. 🎜🎜🎜🎜non-youngs/s
: old
영역에서 young
영역의 선두로 이동할 수 없는 모든 초를 나타냅니다. 시간 제한이 충족되지 않았습니다. 🎜🎜🎜🎜읽은 페이지
, 생성
, 작성
: 읽고, 만들고, 쓴 페이지 수를 나타냅니다. 읽기, 만들기, 쓰기 비율이 그 뒤를 이었습니다. 🎜🎜🎜🎜버퍼 풀 적중률
: 지난 기간 동안 평균 1,000회의 페이지 방문 동안 페이지가 버퍼 풀
에 캐시된 횟수를 나타냅니다. 🎜🎜🎜🎜젊은 비율
: 과거 특정 기간 동안 해당 페이지를 평균 1,000회 방문했으며, 몇 번의 방문이 페이지를 선두로 이동했는지 나타냅니다. 젊은
지역. 🎜🎜모두가 주의해야 할 점은 여기서 계산하는 young
영역으로 페이지가 이동한 횟수에는 old
영역에서만 이동한 횟수가 포함되지 않는다는 점입니다. young
으로 young
영역에서 young
의 선두로 이동한 횟수를 포함하여 code> 영역의 선두에 있는 횟수입니다. 지역(young
지역의 노드를 방문합니다. 노드가 young
영역보다 1/4 뒤에 있는 한 의 선두로 이동됩니다. 젊은
지역). 🎜🎜🎜🎜not(young-making rate)
: 과거 특정 기간 동안 해당 페이지를 평균 1,000회 방문하였고, 몇 번의 방문이 페이지를 이동시키지 않았는지 나타냅니다. 젊은
지역 책임자에게. 🎜🎜모두가 주의해야 할 점은 여기서 계산되는 young
영역의 헤더로 페이지가 이동되지 않은 횟수에는 innodb_old_blocks_time 설정으로 인한 방문수뿐만 아니라
시스템 변수 노드가 old
영역에 있지만 young
영역으로 이동되지 않았습니다. 노드가 young의 처음 1/4에 있기 때문입니다.
영역 young
영역의 선두로 이동한 횟수입니다. 🎜🎜🎜🎜LRU len
: LRU 연결 목록
의 노드 수를 나타냅니다. 🎜🎜🎜🎜unzip_LRU
: unzip_LRU 연결 목록
의 노드 수를 나타냅니다(이 연결 목록에 대해 구체적으로 언급하지 않았으므로 이제 해당 값은 무시할 수 있습니다). 🎜🎜🎜🎜I/O 합계
: 지난 50초 동안 읽은 총 디스크 페이지 수입니다. 🎜🎜🎜🎜I/O cur
: 현재 읽고 있는 디스크 페이지 수입니다. 🎜🎜🎜🎜I/O unzip sum
: 지난 50초 동안 압축이 풀린 페이지 수입니다. 🎜🎜🎜🎜I/O unzip cur
: 압축이 풀리는 페이지 수. 🎜
磁盘太慢,用内存作为缓存很有必要。
Buffer Pool
本质上是InnoDB
向操作系统申请的一段连续的内存空间,可以通过innodb_buffer_pool_size
来调整它的大小。
Buffer Pool
向操作系统申请的连续内存由控制块和缓存页组成,每个控制块和缓存页都是一一对应的,在填充足够多的控制块和缓存页的组合后,Buffer Pool
剩余的空间可能产生不够填充一组控制块和缓存页,这部分空间不能被使用,也被称为碎片
。
InnoDB
使用了许多链表
来管理Buffer Pool
。
free链表
中每一个节点都代表一个空闲的缓存页,在将磁盘中的页加载到Buffer Pool
时,会从free链表
中寻找空闲的缓存页。
为了快速定位某个页是否被加载到Buffer Pool
,使用表空间号 + 页号
作为key
,缓存页作为value
,建立哈希表。
在Buffer Pool
中被修改的页称为脏页
,脏页并不是立即刷新,而是被加入到flush链表
中,待之后的某个时刻同步到磁盘上。
LRU链表
分为young
和old
两个区域,可以通过innodb_old_blocks_pct
来调节old
区域所占的比例。首次从磁盘上加载到Buffer Pool
的页会被放到old
区域的头部,在innodb_old_blocks_time
间隔时间内访问该页不会把它移动到young
区域头部。在Buffer Pool
没有可用的空闲缓存页时,会首先淘汰掉old
区域的一些页。
我们可以通过指定innodb_buffer_pool_instances
来控制Buffer Pool
实例的个数,每个Buffer Pool
实例中都有各自独立的链表,互不干扰。
自MySQL 5.7.5
版本之后,可以在服务器运行过程中调整Buffer Pool
大小。每个Buffer Pool
实例由若干个chunk
组成,每个chunk
的大小可以在服务器启动时通过启动参数调整。
可以用下边的命令查看Buffer Pool
的状态信息:
SHOW ENGINE INNODB STATUS\G
推荐学习:mysql视频教程
위 내용은 MySQL 원리에 대한 심층적인 이해: 버퍼 풀(자세한 그래픽 및 텍스트 설명)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!