1.系统文件IO

2.文件管理的内存结构

3总结

首页

数据库

mysql教程

MySQL系列：innodb引擎分析之文件IO_MySQL

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 01, 2016 pm 01:04 PM

引擎文件

innodb作为数据库引擎，自然少不了对文件的操作，在innodb中所有需要持久化的信息都需要文件操作，例如：表文件、重做日志文件、事务日志文件、备份归档文件等。innodb对文件IO操作可以是煞费苦心，其主要包括两方面，一个是对异步io的实现，一个是对文件操作管理和io调度的实现。在MySQL-5.6版本的innodb还加入了DIRECT IO实现。做了这么多无非是优化io操作的性能。在innodb的文件IO部分中，主要实现集中在os_file.*和fil0fil.*两个系列的文件当中，其中os_file*是实现基本的文件操作、异步IO和模拟异步IO。fil0fil.*是对文件io做系统的管理和space结构化。下面依次来介绍这两个方面的内容.

1.系统文件IO

在innodb中，文件的操作是比较关键的，innodb封装了基本的文件操作，例如：文件打开与关闭、文件读写以及文件属性访问等。这些是基本的文件操作函数封装。在linux文件的读写方面，默认是采用pread/pwrite函数进行读写操作，如果系统部支持这两个函数，innodb用lseek和read、write函数联合使用来达到效果. 以下是innodb文件操作函数: os_file_create_simple 创建或者打开一个文件 os_file_create 创建或者打开一个文件，如果操作失败会重试，直到成功 os_file_close 关闭打开的文件 os_file_get_size 获得文件的大小 os_file_set_size 设置文件的大小并以0填充文件内容 os_file_flush 将写的内容fsync到磁盘 os_file_read 从文件中读取数据 os_file_write 将数据写入文件 innodb除了实现以上基本的操作以外，还实现了文件的异步IO模型，在Windows下采用的IOCP模型来进行处理（具体可以见网上的资料），在linux下是采用aio来实现的，有种情况，一种是通过系统本身的aio机制来实现，还有一种是通过多线程信号模拟来实现aio.这里我们重点来介绍，为了实现aio,innodb定义了slot和slot array,具体数据结构如下：

typedef struct os_aio_slot_struct
{
     ibool	 is_read;                             /*是否是读操作*/
     ulint	 pos;                                    /*slot array的索引位置*/
     ibool	 reserved;                           /*这个slot是否被占用了*/
     ulint	 len;                                     /*读写的块长度*/
     byte*	 buf;                                   /*需要操作的数据缓冲区*/
     ulint	 type;                                   /*操作类型：OS_FILE_READ OS_FILE_WRITE*/
     ulint	 offset;                                 /*当前操作文件偏移位置，低32位*/
     ulint	 offset_high;                        /*当前操作文件偏移位置，高32位*/
     os_file_t	 file;                               /*文件句柄*/
     char*	 name;                               /*文件名*/
     ibool	 io_already_done;             /*在模拟aio的模式下使用，TODO*/
     void*	 message1;
     void*	 message2;
#ifdef POSIX_ASYNC_IO
     struct aiocb	control;                 /*posix 控制块*/
#endif
}os_aio_slot_t;

typedef struct os_aio_array_struct
{
 os_mutex_t	 mutex;          /*slots array的互斥锁*/
 os_event_t	 not_full;         /*可以插入数据的信号，一般在slot数据被aio操作后array_slot有空闲可利用的slot时发送*/
 os_event_t	 is_empty;       /*array 被清空的信号，一般在slot数据被aio操作后array_slot里面没有slot时发送这个信号*/

 ulint	 n_slots;                     /*slots总体单元个数*/
 ulint	 n_segments;             /*segment个数，一般一个对应n个slot，n = n_slots/n_segments，一个segment作为aio一次的操作范围*/
 ulint	 n_reserved;              /*有效的slots个数*/
 os_aio_slot_t*	slots;         /*slots数组*/

 os_event_t*	 events;         /*slots event array，暂时没弄明白做啥用的*/
}os_aio_array_t;

登录后复制

内存结构关系图:

2.文件管理的内存结构

在innodb中定义三种文件类型：表空间文件(ibdata*)、重做日志文件(ib_logfile*)和归档文件(ib_arch_log*)。一般innodb在运行的过程中，会同时打开很多个文件，这就要求对文件进行系统的管理和控制。在innodb中定义了一套基于fil_system_t、fil_space_t和fil_node_t的内存管理结构。每个文件对应的是一个fil_node_t,fil_node是存储的最小单元，多个同一模块的fil_node组成一个fil_space_t，所有的space组成一个fil_system_t，在innodb引擎里，只有一个fil_system_t对象。

fil_system_t管理着全局的文件操作资源，例如：文件打开的数量、打开文件的信号控制、fil_space_t的管理和索引等。以下是fil_system_t的结构定义：

typedef struct fil_system_struct
{
     mutex_t	 mutex;              /*file system的保护锁*/
     hash_table_t*	spaces;     /*space的哈希表，用于快速检索space,一般是通过space id查找*/
     ulint	 n_open_pending;  /*当前有读写IO操作的fil_node个数*/
     ulint	 max_n_open;         /*最大允许打开的文件个数*/
     os_event_t	 can_open;    /*可以打开新的文件的信号*/
 
    UT_LIST_BASE_NODE_T(fil_node_t) LRU;       /*最近被打开操作过的文件,用于快速定位关闭的fil_node*/
    UT_LIST_BASE_NODE_T(fil_node_t) space_list;	 /*file space的对象列表*/
}fil_system_t;

登录后复制

值得注意的是space的哈希表和LRU,这里为什么会出现用hash table来索引space呢？因为在实际的数据库系统中，fil_space_t是会非常多的，用哈希表能快速定位到需要操作的fil_space_t。LRU是用于保存最近被打开和被操作过的fil_node,为了避免频发的关闭和打开文件，LRU保存一定数量（500）的最近打开过的文件，这样可以提高系统的效率。

fil_space_t是用于管理同一模块的file_node,上层模块操作文件不是以文件名来做操作关联的，而是用space_id，

也就是说，所有的文件操作是通过space为单位进行操作的。fil_space支持三种类型，分别是：
FIL_TABLESPACE 表空间space
FIL_LOG 重做日志space
FIL_ARCHI_LOG 归档日志space

fil_space_t的定义如下：

struct fil_space_struct
{
     char*	 name;                     /*space名称*/
     ulint	 id;                            /*space id*/
     ulint	 purpose;                 /*space的类型，主要有space table, log file和arch file*/
     ulint	 size;                         /*space包含的页个数*/
     ulint	 n_reserved_extents; /*预留的页个数*/
     hash_node_t	 hash;          /*chain node的HASH表*/
     rw_lock_t	 latch;               /*space操作保护锁,用于多线程并发*/
     ibuf_data_t*	ibuf_data;   /*space 对应的insert buffer*/
     ulint	 magic_n;                 /*魔法校验字*/

     UT_LIST_BASE_NODE_T(fil_node_t) chain;
     UT_LIST_NODE_T(fil_space_t)	 space_list;
};

登录后复制

fil_space通常是由一组文件组成，例如重做日志，一般是有3个文件组成一个group space用于重做日志记录。space通过成员latch可以支持多线程并发的。在innodb文件操作中，主要是通过space来做控制，以下是它的控制函数：
fil_space_create 创建一个fil_space
fil_space_free 销毁一个fil_space
fil_space_truncate_start 从space中删除fil_node，删除的总数据长度为trunc_len
fil_node_create 创建一个fil_node并加入到对应的space当中
fil_space_get_size 获得space的空间大小，以page为单位记
fil_io 指定space的io操作
fil_aio_wait aio异步方式的io操作等待,并根据完成状态更新space状态
fil_flush 指定space进行数据刷盘
fil_node_t是对单个文件进行管理，主要是管理文件的打开状态、文件句柄信息、文件的page数量和更新状态等。

其结构定义如下：

struct fil_node_struct
{
     char*	 name;                         /*文件路径名*/
     ibool	 open;                         /*文件是否被打开*/
     os_file_t	handle;                  /*文件句柄*/
     ulint	 size;                             /*文件包含的页个数，一个页是16K*/
     ulint	 n_pending;                 /*等待读写IO操作的个数*/
     ibool	 is_modified;               /*是否有脏也存在，flush是根据这个标志进行刷盘的*/
     ulint	 magic_n;                     /*魔法校验字*/
     UT_LIST_NODE_T(fil_node_t) chain;
     UT_LIST_NODE_T(fil_node_t) LRU;
};

登录后复制

值得注意的是当外部调用了fil_flush时，判断一个fil_node是否需要刷盘的必要条件是：
文件必须是打开的 open = TRUE
文件存在内存和硬盘数据不一致 is_modified = TRUE

了解了他们三者的基本定义后，那他们之间的关系是怎么的？不用文字叙述，看下面的内存结构关系图：

在了解了他们之间的基本关系后，那么一个io操作是怎么进行的？在这个模型里，一个io操作提交和被运行是比较复杂的。具体流程如下： 1.外部模块提交一个fil_io, 先会进行基本的io操作类型的判断和文件打开方式的判断。 2.然后进行对正在进行io操作的计数做判断，如果正在进行的io数量 > 最大文件打开数量的四分之三，唤醒所有aio的操作线程进行io处理，并进行sleep等待。 3.如果正在进行的io数量 = 最大文件打开数量,唤醒所有的aio操作线程进行io处理，并等待fil_system_t的can_open信号。 4.如果不满足2和3，找到需要受理io操作的space和node,并打开node对应的文件，打开文件时会对打开文件数量限制做判断，如果当前打开文件操作io的数量 + LRU里已经打开文件的数量>= 最大文件打开数量时，会取出LRU中最后一个fil_node进行文件关闭。然后在对新的io操作的fil_node文件进行打开。 5.fil_node文件打开后，调用os_aio进行io操作提交，然后等待io操作完成 6. io操作完成后，将完成io操作的fil_node放入LRU的第一个位置，并更改对应的fil_system/fil_space/fil_node的状态，最后触发一个fil_system的can open信号。 7.监听can_open的线程收到这个信号后，会跳到第4步进行自己的io操作提交。流程图如下：

3总结

总体来说，innodb的文件IO涉及到知识面很多，可以能短时间无法完全理解透彻，一般在阅读源码的时候可以做一些基本的单元测试，这样有助于理解。弄清楚innodb的文件IO操作是非常有必要的，因为文件IO操作模块直接影响对innodb的日志系统的理解、表空间系统的理解。而且Innodb在文件IO模块的改进还是比较大的，尤其是引入Direct IO后。Direct IO很多数据库都在用这个技术，除了innodb,oracle和淘宝的oceanbase都使用了这个技术, 关于Direct IO网络上资料很多，可以自行结合MySQL-5.6的innodb来做研究。

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

Undresser.AI Undress

人工智能驱动的应用程序，用于创建逼真的裸体照片

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

免费脱衣服图片

Clothoff.io

AI脱衣机

AI Hentai Generator

免费生成ai无尽的。

显示更多

热工具

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

中文版，非常好用

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

显示更多

热门话题

gmail邮箱登陆入口在哪里

7422

CakePHP 教程

1359

steam的账户名称是什么格式

win11激活密钥永久

显示更多

Related knowledge

微信文件过期怎么恢复微信的过期文件能恢复吗 Feb 22, 2024 pm 02:46 PM

打开微信，在我中选择设置，选择通用后选择存储空间，在存储空间选择管理，选择要恢复文件的对话选择感叹号图标。教程适用型号：iPhone13系统：iOS15.3版本：微信8.0.24解析1首先打开微信，在我的页面中点击设置选项。2接着在设置页面中找到并点击通用选项。3然后在通用页面中点击存储空间。4接下来在存储空间页面中点击管理。5最后选择要恢复文件的对话，点击右侧的感叹号图标。补充：微信文件一般几天过期1要是微信接收的文件并没有点开过的情况下，那在七十二钟头之后微信系统会清除掉，要是己经查看了微信

照片无法打开此文件，因为格式不受支持或文件已损坏 Feb 22, 2024 am 09:49 AM

在Windows系统中，照片应用是一个便捷的方式来查看和管理照片和视频。通过这个应用程序，用户可以轻松访问他们的多媒体文件，而无需安装额外的软件。然而，有时候用户可能会碰到一些问题，比如在使用照片应用时遇到“无法打开此文件，因为不支持该格式”的错误提示，或者在尝试打开照片或视频时出现文件损坏的问题。这种情况可能会让用户感到困惑和不便，需要进行一些调查和修复来解决这些问题。当用户尝试在Photos应用程序上打开照片或视频时，会看到以下错误。抱歉，照片无法打开此文件，因为当前不支持该格式，或者该文件

在Windows 11/10中，准备删除要花费很长时间 Feb 19, 2024 pm 07:42 PM

在本文中，我们将介绍如何解决在Windows系统中删除文件或文件夹时出现“准备删除”提示的问题。这个提示意味着系统正在进行一些后台操作，如检查文件权限、验证文件是否被其他程序占用、计算要删除项目的大小等。我们将为您提供一些解决方法，以确保您能够顺利删除文件，而无需等待太长时间。为什么Windows要花这么长时间才能删除文件？Windows准备删除文件所需的时间受多种因素影响，包括文件大小、存储设备速度和后台进程。长时间或被卡住的“正在准备删除”提示可能暗示系统资源不足、磁盘错误或文件系统问题。在

可以删除Tmp格式文件吗？ Feb 24, 2024 pm 04:33 PM

Tmp格式文件是一种临时文件格式，通常由计算机系统或程序在执行过程中生成。这些文件的目的是存储临时数据，以帮助程序正常运行或提高性能。一旦程序执行完成或计算机重启，这些tmp文件往往就没有了存在的必要性。所以，对于Tmp格式文件来说，它们本质上是可以删除的。而且，删除这些tmp文件能够释放硬盘空间，确保计算机的正常运行。但是，在删除Tmp格式文件之前，我们需

出现0x80004005错误代码怎么办小编教你0x80004005错误代码解决方法 Mar 21, 2024 pm 09:17 PM

在电脑中删除或解压缩文件夹，时有时候会弹出提示对话框“错误0x80004005：未指定错误”，如果遇到这中情况应该怎么解决呢？提示错误代码0x80004005的原因其实有很多，但大部分因为病毒导致，我们可以重新注册dll来解决问题，下面，小编给大伙讲解0x80004005错误代码处理经验。有用户在使用电脑时出现错误代码0X80004005的提示，0x80004005错误主要是由于计算机没有正确注册某些动态链接库文件，或者计算机与Internet之间存在不允许的HTTPS连接防火墙所引起。那么如何

夸克网盘的文件怎么转移到百度网盘？ Mar 14, 2024 pm 02:07 PM

　　夸克网盘和百度网盘都是现在最常用的储存文件的网盘软件，如果想要将夸克网盘内的文件保存到百度网盘，要怎么操作呢？本期小编整理了夸克网盘电脑端的文件转移到百度网盘的教程步骤，一起来看看是怎么操作吧。　　夸克网盘的文件怎么保存到百度网盘？要将夸克网盘的文件转移到百度网盘，首先需在夸克网盘下载所需文件，然后在百度网盘客户端中选择目标文件夹并打开。接着，将夸克网盘中下载的文件拖放到百度网盘客户端打开的文件夹中，或者使用上传功能将文件添加至百度网盘。确保上传完成后在百度网盘中查看文件是否成功转移。这样就

如何安装GHO文件 Feb 19, 2024 pm 10:06 PM

gho文件是一种GhostImage影像文件，它通常用于将整个硬盘或分区的数据备份成一个文件。在一些特定的情况下，我们需要将这种gho文件重新安装回硬盘上，以还原硬盘或分区到先前的状态。下面将介绍gho文件的安装方法。首先，在安装之前，我们需要准备以下工具和材料：实体的gho文件：确保你拥有一份完整的gho文件，它通常以.gho为后缀名，并且包含有备份

hiberfil.sys是什么文件？hiberfil.sys可以删除吗？ Mar 15, 2024 am 09:49 AM

　　最近有很多网友问小编，hiberfil.sys是什么文件？hiberfil.sys占用了大量的C盘空间可以删除吗？小编可以告诉大家hiberfil.sys文件是可以删除的。下面就来看看详细的内容。hiberfil.sys是Windows系统中的一个隐藏文件，也是系统休眠文件。通常存储在C盘根目录下，其大小与系统安装内存大小相当。这个文件在计算机休眠时被使用，其中包含了当前系统的内存数据，以便在恢复时快速恢复到之前的状态。由于其大小与内存容量相等，因此它可能会占用较大的硬盘空间。　　hiber

See all articles

MySQL系列：innodb引擎分析之文件IO_MySQL

1.系统文件IO

2.文件管理的内存结构

3总结

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题