MySQL 데이터의 지속성 프로세스를 이해하면 기본 MySQL에 대한 이해를 심화하는 데 도움이 될 수 있습니다. 관심이 있다면 이 과정을 깊이 있게 연구하고 연구할 수 있습니다.
MySQL 데이터 저장은 일반적으로 메모리의 저장 프로시저와 하드 디스크의 영구 저장의 두 부분으로 나눌 수 있습니다. 여기에는 메모리의 버퍼 폴
과 redo 로그가 포함됩니다. code> 및 <code>트랜잭션 로그
및 테이블 구조
를 디스크에 저장합니다. 이 문서에서는 각 부분의 구체적인 디자인을 자세히 설명하지 않고 개념적인 이해만 제공합니다. buffer poll
和redo log
以及磁盘上的事务日志
和表结构
,在本文中,我们不具体解释每一部分的具体设计,只是给大家一个概念型的认识:
buffer poll
是InnoDB引擎缓存池的一部分,我们这里可以简单理解为数据库从磁盘读进内存的内存块的缓存;
redo log
是内存中的逻辑日志,记录了事务的变更操作
事务日志
是磁盘上的食物逻辑日志
表结构
是真正存储数据的结构
buffer poll
中有对于读入内存的数据的缓存,在查询命令执行时,会优先在缓存中查看是否命中,未命中就会从磁盘中将需要的数据读进来,缓存的管理使用的是改良的LRU算法,这里不做深入地介绍了。
当一条修改指令运行的时候,首先进行的是对于buffer poll
中缓存的修改,被修改后的数据会被标记为脏页
,同时,修改的操作也会记录在redo log
中,我们常说的MVCC中的版本链就是借助redo log
实现的。
需要注意的是,脏页不是立刻落到磁盘的,而是有可以设置的刷盘控制机制,例如,一个事务执行结算后立刻落盘,按照一定时间定期落盘等等。
在内存中的操作都是非持久化的,如果这时发生了意料之外的问题导致系统宕机,数据是还没有持久化的,所以理论上也不会对数据库造成破坏性的影响。
InnoDB在磁盘的持久化分为两步,第一步是逻辑日志的存储,之后再将日志中的数据刷进磁盘空间。
在讨论为什么要使用逻辑日志之前,我们需要简单理解随机IO
与顺序IO
的区别:
寻址过程是磁盘IO中的一个重要瓶颈,因为它需要将探针移动到需要读取的位置来读取磁盘数据。
顺序IO
是指寻址的空间是连续的,移动距离很短,随机IO
是指我们需要寻找的地址分布在各处,需要移动很长的距离。
所以,我们能很明晰的得出结论:将随机IO
替换为顺序IO
buffer poll
은 InnoDB 엔진 캐시 풀의 일부입니다. 여기서는 데이터베이스가 수행하는 메모리 블록의 캐시로 간단히 이해할 수 있습니다. ;
redo log
는 메모리의 논리적 로그인으로, 트랜잭션 변경 작업을 기록합니다
트랜잭션 로그
디스크에 있는 음식 논리 로그입니다
테이블 구조
는 실제로 데이터가 저장되는 구조입니다
버퍼 폴
에서 캐시를 수정하는 것입니다. 동시에 수정된 데이터는 더티 페이지
로 표시됩니다. 수정 작업은 redo 로그
에도 기록됩니다. 우리가 흔히 말하는 MVCC의 버전 체인은 redo 로그
의 도움으로 구현됩니다. 🎜🎜더티 페이지는 즉시 디스크에 삭제되지 않지만 설정할 수 있는 플러시 제어 메커니즘이 있습니다. 예를 들어 트랜잭션은 결제 후 즉시 디스크에 삭제되고 정기적으로 디스크에 삭제됩니다. 특정 시간 등 🎜🎜메모리의 모든 작업은 비영구적입니다. 예상치 못한 문제가 발생하여 시스템이 충돌하더라도 데이터는 지속되지 않으므로 이론적으로 데이터베이스에 파괴적인 영향을 미치지 않습니다. 🎜🎜3. 디스크 지속성🎜🎜3.1 트랜잭션 로그의 역할🎜🎜InnoDB의 디스크 지속성은 두 단계로 나누어집니다. 첫 번째 단계는 논리적 로그를 저장한 다음 로그의 데이터를 디스크 공간에 플러시하는 것입니다. 🎜🎜논리 로그를 사용해야 하는 이유를 논의하기 전에 임의 IO
와 순차 IO
의 차이점을 간략하게 이해해야 합니다.🎜🎜주소 지정 프로세스는 디스크 데이터를 읽으려면 프로브를 읽어야 하는 위치로 프로브를 이동해야 하므로 디스크 IO에 심각한 병목 현상이 발생합니다. 🎜🎜순차 IO
는 주소 지정 공간이 연속적이고 이동 거리가 매우 짧다는 것을 의미합니다. 랜덤 IO
는 우리가 찾아야 할 주소가 모든 곳에 분산되어 있어야 함을 의미합니다. 매우 빠르게 장거리를 이동했습니다. 🎜🎜그래서 우리는 Random IO
를 Sequential IO
로 대체하면 디스크 IO의 효율성을 효과적으로 향상시킬 수 있다는 결론을 내릴 수 있습니다. 이것이 바로 논리 로그의 역할이기 때문입니다. 로그 파일은 디스크에 연속적으로 존재하므로 데이터 테이블 정보가 어디에나 분산되어 있는 것에 비해 IO 효율성이 훨씬 높을 수 있습니다. 🎜🎜트랜잭션 로그의 작업을 완전히 업데이트하면 트랜잭션이 성공적으로 유지되고 전용 스레드가 로그 정보를 테이블 구조에 저장하는 역할을 담당하게 됩니다. 🎜🎜3.2 테이블 구조의 2단계 저장🎜🎜 로그 정보를 테이블 구조에 저장하는 과정은 두 단계로 나누어집니다. 먼저 업데이트 후 테이블 헤더의 캐시 영역에 데이터가 업데이트됩니다. 완료되면 해당 테이블 구조 새로 고침에서 데이터가 업데이트됩니다. 🎜🎜2단계 저장의 목적은 데이터 저장의 강력한 일관성을 보장하고 디스크에 플래시하는 과정에서 데이터베이스 가동 중지 시간으로 인해 데이터가 불완전해지는 것을 방지하는 것입니다. 🎜🎜테이블 헤더의 캐시 영역과 테이블 구조의 저장 블록에는 데이터의 무결성을 확인하는 체크 코드가 있습니다. 전자는 완전하고 후자는 불완전한 경우 이전 데이터를 다시 플래시하면 됩니다. 전자가 불완전하면 로그 플러시 프로세스가 실패했음을 의미하므로 다시 플러시하면 됩니다. 🎜위 내용은 MySQL 데이터 지속성 프로세스 예시 분석의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!