linux io指的是什麼-linux運維-PHP中文網

Linux的IO模型

#基本概念

同步阻塞

同步非阻塞

IO多路復用

訊號驅動

首頁

運維

linux運維

linux io指的是什麼

藏色散人

Mar 24, 2023 am 09:43 AM

linux io

linux io指的是一種檔案操作；在Linux中，檔案就是一串二進位流，那麼在資訊的交換過程中，我們都是對這些流進行資料收發操作，這些操作簡稱為I/O操作；由於Linux使用的是虛擬記憶體機制，所以必須透過系統呼叫請求核心來完成IO動作。

linux io指的是什麼

本教學操作環境：linux5.9.8系統、Dell G3電腦。

linux io指的是什麼？

我們都知道在Linux的世界，一切皆檔案。

而檔案就是一串二進位流，不管Socket、FIFO、管道還是終端，對我們來說，一切都是流。

在資訊的交換過程中，我們都是對這些流進行資料收發操作，簡稱為I/O操作。
往流讀取數據，系統呼叫Read，寫入數據，系統呼叫Write。

通常使用者程序的一個完整的IO分為兩個階段：

磁碟IO：

linux io指的是什麼

網路IO：

linux io指的是什麼

作業系統和驅動程式運行在核心空間，應用程式運行在用戶空間，兩者不能使用指標傳遞數據，因為Linux使用的虛擬記憶體機制，必須透過系統呼叫請求核心來完成IO動作。

IO有記憶體IO、網路IO和磁碟IO三種，通常我們說的IO指的是後兩者！

為什麼需要IO模型

如果使用同步的方式來通訊的話，所有的操作都在一個執行緒內順序執行完成，這麼做缺點是很明顯的：

因為同步的通訊操作會阻塞同一個執行緒的其他任何操作，只有這個操作完成了之後，後續的操作才可以完成，所以出現了同步阻塞多執行緒（每個Socket都建立一個執行緒對應），但是系統內執行緒數量是有限制的，同時執行緒切換很浪費時間，適合Socket少的情況。

因該需要出現IO模型。

Linux的IO模型

在描述Linux IO模型之前，我們先來了解Linux系統資料讀取的過程：

linux io指的是什麼

以使用者請求index.html檔案為範例說明

linux io指的是什麼

#基本概念

使用者空間與內核空間

作業系統的核心是內核，獨立於普通的應用程序，可以存取受保護的記憶體空間，也有存取底層硬體設備的所有權限。

為了確保內核的安全，使用者行程不能直接操作內核，作業系統將虛擬空間分割為兩部分，一部分為內核空間，一部分為使用者空間。

進程切換

為了控制進程的執行，核心必須有能力掛起正在CPU上執行的進程，並恢復先前掛起的某個進程的執行。

這種行為稱為進程切換。

因此可以說，任何進程都是在作業系統核心的支援下運行的，是與核心緊密相關的。

進程的阻塞

正在執行的進程，由於期待的某些事件未發生，例如請求系統資源失敗、等待某種操作的完成、新數據尚未到達或無新工作做等，則由系統自動執行阻塞原語(Block)，使自己由運行狀態變為阻塞狀態。

可見，進程的阻塞是進程本身的主動行為，也因此只有處於運行態的進程（獲得CPU），才可能將其轉換為阻塞狀態。

當行程進入阻塞狀態，是不佔用CPU資源的。

檔案描述子

檔案描述子（File Descriptor）是電腦科學中的一個術語，是一個用於表述指向文件的引用的抽象化概念。

檔案描述子在形式上是一個非負整數，實際上，它是一個索引值，指向核心為每個行程所維護的該行程開啟檔案的記錄表。

當程式開啟一個現有檔案或建立一個新檔案時，核心會向進程傳回一個檔案描述符。

快取IO

大多數檔案系統的預設 IO 操作都是快取 IO。

其讀寫過程如下：

讀取操作：作業系統檢查核心的緩衝區有沒有需要的數據，如果已經快取了，那麼就直接從快取中返回；否則從磁碟、網路卡等中讀取，然後快取在作業系統的快取中；
寫入操作：將資料從使用者空間複製到核心空間的快取中。這時對使用者程式來說寫操作就已經完成，至於什麼時候再寫到磁碟、網卡等中由作業系統決定，除非顯示地呼叫了 sync 同步指令。

假設核心空間快取無需要的數據，使用者行程從磁碟或網路讀取資料分兩個階段：

階段一： 核心程式從磁碟、網路卡等讀取資料到核心空間快取區；
#階段二： 使用者程式從核心空間快取拷貝數據到用戶空間。

快取IO 的缺點：

資料在傳輸過程中需要在應用程式位址空間和核心空間進行多次資料拷貝操作，這些資料拷貝操作所帶來的CPU以及記憶體開銷非常大。

同步阻塞

用戶空間的應用程式執行一個系統調用，這會導致應用程式阻塞，什麼也不乾，直到資料準備好，並且將資料從核心複製到用戶進程，最後進程再處理數據，在等待數據到處理數據的兩個階段，整個進程都被阻塞，不能處理別的網路IO。

呼叫應用程式處於不再消費 CPU 而只是簡單等待回應的狀態，因此從處理的角度來看，這是非常有效的。

這也是最簡單的IO模型，在通常FD較少、就緒很快的情況下使用是沒有問題的。

linux io指的是什麼

同步非阻塞

非阻塞的系統呼叫呼叫之後，進程並沒有被阻塞，核心馬上回傳給進程，如果資料還沒準備好，此時會回傳一個error。

進程在回傳之後，可以做點別的事情，然後再發起系統呼叫。
重複上面的過程，循環往復的進行系統呼叫。這個過程通常被稱之為輪詢。
輪詢檢查內核數據，直到數據準備好，再拷貝數據到進程，進行數據處理。
需要注意，拷貝資料整個過程，進程仍然是屬於阻塞的狀態。
這種方式在程式設計中對Socket設定O_NONBLOCK即可。

linux io指的是什麼

IO多路復用

IO多路復用，這是一種進程預先告知核心的能力，讓核心發現進程指定的一個或多個IO條件就緒了，就通知進程。

使得一個行程能在一連串的事件上等待。

IO複用的實作方式目前主要有Select、Poll和Epoll。

linux io指的是什麼

偽代碼描述IO多路復用：

while(status == OK) { // 不断轮询 ready_fd_list = io_wait(fd_list); //内核缓冲区是否有准备好的数据 for(fd in ready_fd_list) {  data = read(fd) // 有准备好的数据读取到用户缓冲区  process(data) }}

登入後複製