想弄清楚Linux文件系统的运行机制吗?-电脑知识-PHP中文网

缓冲与非缓冲I/O

直接 I/O与非直接I/O

阻塞I/O和非阻塞I/O

同步和异步 I/O

首页

电脑教程

电脑知识

想弄清楚Linux文件系统的运行机制吗?

PHPz

Feb 20, 2024 am 09:54 AM

linux 目录文件系统数据访问持久化存储

想弄清楚Linux文件系统的运行机制吗?

Linux文件系统作为操作系统的核心组成部分，其运行机制也是我们程序员需要了解和掌握的，磁盘为系统提供了最基本的持久化存储，文件系统则在磁盘的基础上提供系统里所有文件的管理，在Linux里一切皆文件，不仅普通的文件和目录，就连块设备、套接字、管道等，也都要通过统一的文件系统来管理。今天我们就一起来聊一聊：磁盘和文件系统是怎么工作的？

索引节点和目录项

在Linux文件系统中，一个文件的元数据包括：目录项、索引节点、数据块。

目录项：简称为dentry，用来记录文件的名字、索引节点指针以及与其他目录项的关联关系。多个关联的目录项，就构成了文件系统的目录结构。目录项是由内核维护的一个内存数据结构，所以通常也被叫做目录项缓存（Cache）。
索引节点：简称为inode，用来记录文件的元数据，包括inode 编号、文件大小、访问权限、修改日期、数据的位置、链接数等，索引节点信息会持久化到磁盘中存储，占用磁盘空间。
数据块：简称为block，存储文件数据的地方。磁盘的最小存储单位叫做扇区（Sector），每个扇区存储512字节，相当于0.5KB，操作系统读取硬盘的时候，不会一个扇区一个扇区地读取，这样效率太低，而是一次性连续读取多个扇区，即一次性读取一个”块”（block）。这种由多个扇区组成的”块”，是文件存取的最小单位。”块”的大小，最常见的是4KB（八个sector）。

为了加速文件访问，索引节点通常会被加载到内存中，而硬盘在格式化时会划分为超级块、索引节点区和数据块区三个存储区域。

超级块，用来存储文件系统的详细信息，比如块个数、块大小、空闲块等等。
索引节点区，用来存储索引节点。
数据块区，用来存储文件或目录数据。

虚拟文件系统

Linux系统的虚拟文件系统（VFS，Virtual File System）是一个关键的抽象层，它为用户和应用程序提供了一致的文件系统接口，让它们可以以统一的方式访问各种类型的文件系统，而无需担心底层文件系统的实现细节。

用户程序和 glibc 库都属于用户空间，通过调用系统调用层（SCI）的函数来完成文件操作。这些函数是 Linux 内核提供的接口，用于用户向系统请求操作。例如，系统中的cat命令会调用open()函数打开文件，然后调用read()函数读取文件内容，最后调用write()函数将文件内容输出到控制台。常见的文件系统类型可分为几大类。

基于本地磁盘：EXT3、EXT4、XFS、OverlayFS 等。这类文件系统的特点是数据直接存储在计算机本地挂载的磁盘中，性能好，没有网络IO的访问消耗。
基于网络文件系统：NFS、CIFS/SMB、CephFS、GlusterFS等，这类文件的特点是它们允许用户通过网络访问和管理文件。分布式、跨平台、灵活性和可扩缩性是它们的最大优势。
基于内存文件系统：tmpfs、ramfs、/proc等，这些基于内存的文件系统通常用于特定的用途，如临时文件存储、缓存、快速数据访问等。它们提供了在内存中进行文件读写操作的高性能解决方案，但也需要注意内存限制和数据易失性的特点。

文件 I/O

我们进行磁盘分区和格式化是为了建立不同类型的文件系统，这些文件系统必须通过挂载到Linux的VFS上的特定目录才能被系统使用。文件的读写操作有不同的I/O类型，应用程序根据需要选择适当的方式进行。

缓冲与非缓冲I/O

所谓不带缓冲，并不是指内核不提供缓冲，而是只单纯的系统调用，不是函数库的调用。系统内核对磁盘的读写都会提供一个块缓冲，当用write函数对其写数据时，直接调用系统调用，将数据写入到块缓冲进行排队，当块缓冲达到一定的量时，才会把数据写入磁盘。因此所谓的不带缓冲的I/O是指进程不提供缓冲功能。每调用一次write或read函数，直接系统调用。（内核提供缓冲的）。
而带缓冲的I/O是指进程对输入输出流进行了改进，提供了一个流缓冲。当用write函数写数据时，先把数据写入流缓冲区中，当达到一定条件，比如流缓冲区满了，这时候才会把数据一次送往内核提供的块缓冲，再经块缓冲写入磁盘。（双重缓冲）
因此，带缓冲的I/O在往磁盘写入相同的数据量时，会比不带缓冲的I/O调用系统调用的次数要少。

直接 I/O与非直接I/O

直接I/O：就是应用程序直接访问磁盘数据，而不经过内核缓冲区，这样做的目的是减少一次从内核缓冲区到用户程序缓存的数据复制。
非直接I/O：就是文件读写时，先要经过系统的页缓存，然后再由内核或额外的系统调用后写入磁盘。
对于直接I/O，如果访问的数据不在应用程序缓存中，那么每次数据都会直接从磁盘加载，这种直接加载的效率会比较慢。但是类型于数据库管理系统这类应用，它们更倾向于选择它们自己的缓存机制，因为数据库管理系统往往比操作系统更了解数据库中存放的数据，使用直接I/O更合适。

阻塞I/O和非阻塞I/O

阻塞I/O：应用进程调用I/O操作时阻塞，只有等待要操作的数据准备好，并复制到应用进程的缓冲区中才返回。特点是：实现难度低、开发应用较容易，适用并发量小的网络应用开发。
非阻塞I/O：是指应用程序执行 I/O 操作后，不会阻塞当前的线程，可以继续执行其他的任务，随后再通过轮询或者事件通知的形式，获取调用的结果。特点是：相对来说复杂一些。适用并发量较小、且不需要及时响应的网络应用开发

同步和异步 I/O

同步I/O：是指应用程序执行 I/O 操作后，要一直等到整个 I/O 完成后，才能获得 I/O 响应。
异步I/O：是指应用程序执行 I/O 操作后，不用等待完成和完成后的响应，而是继续执行就可以。等到这次 I/O 完成后，响应会用事件通知的方式，告诉应用程序。

关于文件的一些常见小知识

磁盘剩余空间还很多，新建文件和目录报空间不足。

排查思路：大概率是小文件太多，inode用完了，可以使用df -i。

du和df统计的硬盘使用情况不一致问题。

du是统计被文件系统记录到的每个文件的大小，然后进行累加得到的总大小，是通过文件系统获取到的。而df主要是从超级块(superblock)中读入硬盘使用信息，df获取到的是磁盘块被使用的情况。产生这种情况大概率是有文件被删除了，但是有别的进程正在使用它(占有句柄)，可以通过lsof | grep deleted查到。当进程停止或者被kill时，这些空间将被释放。

我们查询磁盘容量的时候，Used+Avail的大小为啥总是小于总容量（SIze）。

为了预防紧急情况，linux ext文件系统会预留部分硬盘空间，具体预留的数值可以通过tune2fs -l [dev_name] | grep “Reserved block count”查看到，(dev_name）是设备名，这里预留的空间会被df计算到已用空间中，从而导致df和du统计不一致。如果需要调整预留空间大小，我们可以使用tune2fs -m [size] [dev_name]来进行调整。

以上是想弄清楚Linux文件系统的运行机制吗?的详细内容。更多信息请关注PHP中文网其他相关文章！

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

热AI工具

热工具

热门话题

gmail邮箱登陆入口在哪里

7681

Java教程

1639

CakePHP 教程

1393

Laravel 教程

1286

PHP教程

1229

显示更多

Related knowledge

vscode需要什么电脑配置 Apr 15, 2025 pm 09:48 PM

VS Code 系统要求：操作系统：Windows 10 及以上、macOS 10.12 及以上、Linux 发行版处理器：最低 1.6 GHz，推荐 2.0 GHz 及以上内存：最低 512 MB，推荐 4 GB 及以上存储空间：最低 250 MB，推荐 1 GB 及以上其他要求：稳定网络连接，Xorg/Wayland（Linux）

vscode 无法安装扩展 Apr 15, 2025 pm 07:18 PM

VS Code扩展安装失败的原因可能包括：网络不稳定、权限不足、系统兼容性问题、VS Code版本过旧、杀毒软件或防火墙干扰。通过检查网络连接、权限、日志文件、更新VS Code、禁用安全软件以及重启VS Code或计算机，可以逐步排查和解决问题。

notepad怎么运行java代码 Apr 16, 2025 pm 07:39 PM

虽然 Notepad 无法直接运行 Java 代码，但可以通过借助其他工具实现：使用命令行编译器 (javac) 编译代码，生成字节码文件 (filename.class)。使用 Java 解释器 (java) 解释字节码，执行代码并输出结果。

vscode是什么 vscode是干什么用的 Apr 15, 2025 pm 06:45 PM

VS Code 全称 Visual Studio Code，是一个由微软开发的免费开源跨平台代码编辑器和开发环境。它支持广泛的编程语言，提供语法高亮、代码自动补全、代码片段和智能提示等功能以提高开发效率。通过丰富的扩展生态系统，用户可以针对特定需求和语言添加扩展程序，例如调试器、代码格式化工具和 Git 集成。VS Code 还包含直观的调试器，有助于快速查找和解决代码中的 bug。

vscode 可以用于 mac 吗 Apr 15, 2025 pm 07:36 PM

VS Code 可以在 Mac 上使用。它具有强大的扩展功能、Git 集成、终端和调试器，同时还提供了丰富的设置选项。但是，对于特别大型项目或专业性较强的开发，VS Code 可能会有性能或功能限制。

VSCode怎么用 Apr 15, 2025 pm 11:21 PM

Visual Studio Code (VSCode) 是一款跨平台、开源且免费的代码编辑器，由微软开发。它以轻量、可扩展性和对众多编程语言的支持而著称。要安装 VSCode，请访问官方网站下载并运行安装程序。使用 VSCode 时，可以创建新项目、编辑代码、调试代码、导航项目、扩展 VSCode 和管理设置。VSCode 适用于 Windows、macOS 和 Linux，支持多种编程语言，并通过 Marketplace 提供各种扩展。它的优势包括轻量、可扩展性、广泛的语言支持、丰富的功能和版

Linux的主要目的是什么？ Apr 16, 2025 am 12:19 AM

Linux的主要用途包括：1.服务器操作系统，2.嵌入式系统，3.桌面操作系统，4.开发和测试环境。Linux在这些领域表现出色，提供了稳定性、安全性和高效的开发工具。

git怎么查看仓库地址 Apr 17, 2025 pm 01:54 PM

要查看 Git 仓库地址，请执行以下步骤：1. 打开命令行并导航到仓库目录；2. 运行 "git remote -v" 命令；3. 查看输出中的仓库名称及其相应的地址。

See all articles

想弄清楚Linux文件系统的运行机制吗?

索引节点和目录项

虚拟文件系统

文件 I/O

缓冲与非缓冲I/O

直接 I/O与非直接I/O

阻塞I/O和非阻塞I/O

同步和异步 I/O

关于文件的一些常见小知识

热AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

热门文章

热工具

记事本++7.3.1

SublimeText3汉化版

禅工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

热门话题