Redis中如何實現無畏宕機快速恢復與持久化-Redis-PHP中文網

RDB 記憶體快照，讓宕機快速恢復

記憶體快照

產生RDB 策略

寫前與寫後日誌比較

日誌格式

寫回策略

優缺點

日誌過大：AOF 重寫機制

Redis 4.0 混合日誌模型

總結

首頁

資料庫

Redis

Redis中如何實現無畏宕機快速恢復與持久化

青灯夜游

Sep 28, 2021 am 10:28 AM

redis 耐力

Redis中如何實現無畏宕機快速恢復和持久化？下面這篇文章帶大家了解一下，希望對大家有幫助！

Redis中如何實現無畏宕機快速恢復與持久化

特立獨行是對的，融入圈子也是對的，重點是要想清楚自己嚮往怎樣的生活，為此願意付出怎樣的代價。

我們通常將Redis 作為快取使用，提高讀取回應效能，一旦Redis 宕機，記憶體中的資料全部遺失，假如現在直接存取資料庫大量流量打到MySQL 可能會帶來更加嚴重的問題。【相關推薦：Redis影片教學】

另外慢慢的從資料庫讀取放到 Redis 效能必然比不過從 Redis 取得快，也會導致回應變慢。

Redis 為了實現無畏宕機快速恢復，設計了兩大殺手鐧，分別是 AOF（Append Only FIle）日誌和 RDB 快照。

學習一個技術，通常只接觸了零散的技術點，沒有在腦海裡建立一個完整的知識框架和架構體系，沒有系統觀。這樣會很吃力，會出現一看好像自己會，過後就忘記，一臉茫然。

跟著「碼哥字節」一起吃透 Redis，深層的掌握 Redis 核心原理以及實戰技巧。搭建一套完整的知識框架，學會全局觀去整理整個知識體系。

本文硬核，建議收藏點贊，靜下心來閱讀，我相信都會有很多收穫。

上一篇文章中分析了 Redis 的核心資料結構、IO 模型、執行緒模型、根據不同資料使用適當的資料編碼。深層掌握真正快的原因！

本篇將圍繞以下幾點展開：

當機後，如何快速復原？
宕機了，Redis 如何避免資料遺失？
什麼是 RDB 記憶體快照？
AOF 日誌實作機制
什麼是寫時複製技術？
….

所涉及的知識點如圖所示：

Redis中如何實現無畏宕機快速恢復與持久化

#Redis 全景圖

全景圖可以圍繞著兩個維度展開，分別是：

應用維度：快取使用、叢集運用、資料結構的巧妙使用

#系統維度：可以歸類為三高

高效能：執行緒模型、網路IO 模型、資料結構、持久化機制；
高可用：主從複製、哨兵叢集、Cluster 分片叢集；
高拓展：負載平衡

Redis 系列篇章圍繞如下心智圖展開，這次一起探索Redis 的高效能、持久化機制的秘密。

Redis中如何實現無畏宕機快速恢復與持久化

擁有全景圖，掌握系統觀。

系統觀其實是至關重要的，從某種程度上說，在解決問題時，擁有了系統觀，就意味著你能有依據、有章法地定位和解決問題。

RDB 記憶體快照，讓宕機快速恢復

#65 哥：Redis 因為某些原因宕機了，會導致所有的流量會打到後端MySQL，我立刻重啟Redis，可是它的數據存在記憶體裡面，重啟後如何還是沒有任何數據，如何防止重啟數據遺失呢？

65 哥別急，「碼哥字節」帶你一步步深入理解到底 Redis 宕機後如何快速恢復的。

Redis 資料儲存在記憶體中，是否可以考慮將記憶體中的資料寫到磁碟上呢？當 Redis 重啟的時候就把保存在磁碟上的資料快速恢復到記憶體中，這樣就能實現重啟後正常提供服務了。

65 哥：我想到一個方案，每次執行「寫入」操作作業記憶體的同時寫入到磁碟

這個方案都有一個致命問題：每次寫入指令不僅寫記憶體還是寫入磁碟，磁碟的效能相對記憶體太慢，會導致Redis 效能大幅降低。

記憶體快照

65 哥：那要如何規避這個同時寫入的問題呢？

我們通常將Redis 當作快取使用，所以即使Redis 沒有保存全部數據，還可以透過資料庫獲取，所以Redis 不會保存所有的數據， Redis 的數據持久化使用了「RDB資料快照」的方式來實現宕機快速恢復。

65 哥：那什麼是 RDB 記憶體快照呢？

在 Redis 執行「寫」指令過程中，記憶體資料會一直改變。所謂的記憶體快照，指的就是 Redis 記憶體中的資料在某一刻的狀態資料。

好比時間定格在某一刻，當我們拍照的，透過照片就能把某一刻的瞬間畫面完全記錄下來。

Redis 跟這個類似，就是把某一刻的資料以檔案的形式拍下來，寫到磁碟上。這個快照檔案叫做 RDB 文件，RDB 就是 Redis DataBase 的縮寫。

Redis 透過定時執行 RDB 記憶體快照，這樣就不必每次執行「寫」指令都寫磁碟，只需要在執行記憶體快照的時候寫磁碟。既保證了唯快不破，還實現了持久化，宕機快速恢復。

Redis中如何實現無畏宕機快速恢復與持久化

在做資料復原時，直接將 RDB 檔案讀入記憶體完成復原。

65 哥：對哪些資料做快照呢？或是多久做一次快照呢？這會影響快照的執行效率。

65 哥不錯呀，開始考慮數據效率問題了。在上一篇文章中我們知道他的單執行緒模型決定了我們要盡可能的避免會阻塞主執行緒的操作，避免 RDB 檔案產生阻塞主執行緒。

產生RDB 策略

##Redis 提供了兩個指令用於產生RDB 檔案：

bgsave：呼叫glibc 的函數
fork產生子程序用於寫入RDB 文件，快照持久化完全交給子程序來處理，父程序繼續處理客戶端請求，產生RDB 檔案的預設配置。

65 哥：那在對記憶體資料做「快照」的時候，記憶體資料還能修改麼？也就是寫指令能否正常處理？

首先我們要明確一點，

避免阻塞和 RDB 檔案產生期間能處理寫入作業不是一回事。雖然主執行緒沒有阻塞，到那時為了確保快照的資料的一致性，只能處理讀取操作，不能修改正在執行快照的資料。

很明顯，為了產生 RDB 而暫停寫入操作，Redis 是不答應的。

65 哥：那 Redis 要如何實作一邊處理寫入請求，同時產生 RDB 檔案呢？

Redis 使用作業系統的多進程

寫入時複製技術 COW(Copy On Write) 來實現快照持久化，這個機制很有意思，也很少人知道。多進程 COW 也是鑑定程式設計師知識廣度的重要指標。

Redis 在持久化時會呼叫 glibc 的函數

fork產生子程序，快照持久化完全交給子程序來處理，父程序繼續處理客戶端請求。

子進程剛產生時，它和父進程共享記憶體裡面的程式碼段和資料段。這時你可以將父子進程想像成連體嬰兒，共享身體。

這是 Linux 作業系統的機制，為了節省記憶體資源，所以盡可能讓它們共享起來。在進程分離的一瞬間，記憶體的成長幾乎沒有明顯變化。

bgsave 子程序可以共享主執行緒的所有記憶體數據，讀取主執行緒的數據並寫入到 RDB 檔案。

在執行

SAVE 指令或BGSAVE指令建立一個新的RDB 檔案時，程式會對資料庫中的鍵進行檢查，已過期的鍵不會被儲存到新建立的RDB 檔案。

當主執行緒執行寫入指令修改資料的時候，這個資料就會複製一份副本，

bgsave 子程序讀取這個副本資料寫到RDB 文件，所以主執行緒就可以直接修改原來的數據。

Redis中如何實現無畏宕機快速恢復與持久化

這既保證了快照的完整性，也允許主執行緒同時對資料進行修改，避免了對正常業務的影響。

Redis 會使用 bgsave 對目前記憶體中的所有資料做快照，這個操作是子程序在背景完成的，這就允許主執行緒同時可以修改資料。

65 哥：那可以每秒鐘都執行 RDB 檔案麼，這樣即使發生宕機最多遺失 1 秒的資料。

過於頻繁的執行全量資料快照，有兩個嚴重效能開銷：

頻繁產生 RDB 檔案寫入磁碟，磁碟壓力過大。會出現上一個 RDB 還沒執行完，下一個又開始生成，陷入死循環。
fork 出 bgsave 子程序會阻塞主線程，主線程的記憶體越大，阻塞時間越長。

優缺點

快照的復原速度快，但是產生RDB 檔案頻率不好把握，頻率過低宕機遺失的資料就會比較多；太快，又會消耗額外開銷。

RDB 採用二進位資料壓縮的方式寫入磁碟，檔案體積小，資料復原速度快。

Redis 除了 RDB 全量快照以外，還設計了 AOF 寫後日誌，接下來我們一起來聊聊什麼是 AOF 日誌。

AOF 寫入後日誌，避免當機資料遺失

AOF 日誌儲存的是Redis 伺服器的順序指令序列，AOF 日誌只記錄對記憶體進行修改的指令記錄。

假設AOF 日誌記錄了自Redis 實例創建以來所有的修改性指令序列，那麼就可以透過對一個空的Redis 實例順序執行所有的指令，也就是「重播」，來恢復Redis 當前實例的內存資料結構的狀態。

寫前與寫後日誌比較

寫前日誌（Write Ahead Log, WAL）： 在實際寫資料之前，將修改的資料寫到日誌檔中，故障復原得以保證。

例如 MySQL Innodb 儲存引擎中的 redo log（重做日誌）便是記錄修改的資料日誌，在實際修改資料前先記錄修改日誌在執行修改資料。

寫後日誌： 先執行「寫」指令請求，將資料寫入內存，再記錄日誌。

Redis中如何實現無畏宕機快速恢復與持久化

日誌格式

當Redis 接受到「set key MageByte」指令將資料寫到記憶體後，Redis 會依照如下格式寫入AOF 檔。

「*3」：表示目前指令分為三個部分，每個部分都是「$ 數字」開頭，緊接在後面是該部分具體的「指令、鍵、值」。
「數字」：表示這部分的指令、鍵、值多佔用的位元組大小。例如 “$3”表示這部分包含 3 個位元組，也就是 “set”指令。

Redis中如何實現無畏宕機快速恢復與持久化

65 哥：為什麼 Redis 使用寫後日誌這種方式呢？

寫入後日誌避免了額外的檢查開銷，不需要對執行的命令進行語法檢查。如果使用寫前日誌的話，就需要先檢查語法是否有誤，否則日誌記錄了錯誤的命令，在使用日誌恢復的時候就會出錯。

另外，寫後才記錄日誌，不會阻塞目前的「寫」指令執行。

65 哥：那有了 AOF 就萬無一失了麼？

傻孩子，可沒這麼簡單。假如 Redis 剛執行完指令，還沒記錄日誌宕機了，就有可能遺失這個指令相關的資料。

還有，AOF 避免了目前指令的阻塞，但可能會為下一個指令帶來阻塞的風險。 AOF 日誌是主執行緒執行，將日誌寫入磁碟過程中，如果磁碟壓力大就會導致寫磁碟很慢，導致後續的「寫入」指令阻塞。

發現了沒，這兩個問題與磁碟寫回有關，如果能合理的控制「寫」指令執行完後 AOF 日誌寫回磁碟的時機，問題就迎刃而解。

寫回策略

為了提高檔案的寫入效率，當使用者呼叫write 函數，將一些資料寫入到檔案的時候，作業系統通常會將寫入資料暫時保存在一個記憶體緩衝區裡面，等到緩衝區的空間被填滿、或超過了指定的時限之後，才真正將緩衝區中的資料寫入到磁碟裡面。

這種做法雖然提高了效率，但也為寫入資料帶來了安全性問題，因為如果電腦發生停機，那麼儲存在記憶體緩衝區裡面的寫入資料將會遺失。

為此，系統提供了fsync和fdatasync兩個同步函數，它們可以強制讓作業系統立即將緩衝區中的資料寫入到硬碟裡面，從而確保寫入資料的安全性。

Redis 提供的 AOF 配置項目appendfsync寫回策略直接決定 AOF 持久化功能的效率和安全性。

always：同步寫回，寫入指令執行完畢立馬將 aof_buf#緩衝區中的內容刷寫到 AOF 檔案。
everysec：每秒寫回，寫入指令執行完，日誌只會寫到 AOF 檔案緩衝區，每隔一秒就把緩衝區內容同步到磁碟。
no： 作業系統控制，寫執行執行完畢，把日誌寫到 AOF 檔案記憶體緩衝區，由作業系統決定何時刷寫到磁碟。

沒有兩全其美的策略，我們需要在性能和可靠性上做一個取捨。

always同步寫回可以做到資料不遺失，但是每個「寫」指令都需要寫入磁碟，效能最差。

everysec每秒寫回，避免了同步寫回的效能開銷，發生宕機可能有一秒位元寫入磁碟的資料遺失，在效能和可靠性之間做了折中。

no作業系統控制，執行寫指令後就寫入 AOF 檔案緩衝就可以執行後續的「寫」指令，效能最好，但有可能遺失很多的資料。

65 哥：那我該如何選擇策略呢？

我們可以根據系統對高效能和高可靠性的要求，來選擇寫回策略。總結一下：想要獲得高效能，就選擇No 策略；如果想要得到高可靠性保證，就選擇Always 策略；如果允許資料有一點遺失，又希望效能別受太大影響的話，那麼就選擇Everysec 策略。

優缺點

優點：執行成功才記錄日誌，避免了指令語法檢查開銷。同時，不會阻塞目前“寫”指令。

缺點：由於 AOF 記錄的是一個指令內容，所以具體格式請看上面的日誌格式。故障復原的時候需要執行每一個指令，如果日誌檔案太大，整個復原過程就會非常緩慢。

另外檔案系統對檔案大小也有限制，不能儲存過大文件，檔案變大，追加效率也會變低。

日誌過大：AOF 重寫機制

65 哥：AOF 日誌檔案過大怎麼辦？

AOF 寫前日誌，記錄的是每個「寫」指令操作。不會像 RDB 全量快照導致效能損耗，但是執行速度沒有 RDB 快，同時日誌檔案過大也會造成效能問題，對於唯快不破的 Redis 這個真男人來說，絕對不能忍受日誌過大導致的問題。

所以，Redis 設計了一個殺手鐧“AOF 重寫機制”，Redis 提供了 bgrewriteaof指令用於對 AOF 日誌進行瘦身。

其原理是開闢一個子程序對記憶體進行遍歷轉換成一系列 Redis 的操作指令，序列化到一個新的 AOF 日誌檔。序列化完畢後再將操作期間發生的增量 AOF 日誌追加到這個新的 AOF 日誌檔中，追加完畢後就立即替代舊的 AOF 日誌檔了，瘦身工作就完成了。

65 哥：為啥 AOF 重寫機制能縮小日誌檔呢？

重寫機制有「多變一」功能，將舊日誌中的多條指令，重寫後就變成了一條指令。

如下：

三條 LPUSH 指令，經過 AOF 重寫後產生一條，對於多次修改的場景，縮減效果更加明顯。

Redis中如何實現無畏宕機快速恢復與持久化

65 哥：重寫後 AOF 日誌變小，最後把整個資料庫最新資料的操作日誌刷寫到磁碟了。重寫會不會阻塞主執行緒呢？

「碼哥」上文說了，AOF 日誌是主執行緒寫回的，AOF 重寫的過程實際上後台子程序 bgrewriteaof 完成，防止阻塞主執行緒。

重寫過程

和AOF 日誌由主執行緒寫回不同，重寫過程是由後台子程序bgrewriteaof 來完成的，這也是為了避免阻塞主線程，導致資料庫效能下降。

總的來說，總共出現 兩個日誌，一次拷貝記憶體資料拷貝，分別是舊的 AOF 日誌和新的 AOF 重寫日誌和 Redis 資料拷貝。

Redis 會將重寫過程中的接收到的「寫」指令操作同時記錄到舊的 AOF 緩衝區和 AOF 重寫緩衝區，這樣重寫日誌也保存最新的操作。等到拷貝資料的所有操作記錄重寫完成後，重寫緩衝區記錄的最新操作也會寫入新的 AOF 檔案。

每次AOF 重寫時，Redis 會先執行一個記憶體拷貝，用於遍歷資料產生重寫記錄；使用兩個日誌保證在重寫過程中，新寫入的資料不會遺失，並且保持資料一致性。

Redis中如何實現無畏宕機快速恢復與持久化

65 哥：AOF 重寫也有重寫日誌，為什麼它不共用使用 AOF 本身的日誌呢？

這個問題問得好，有以下兩個原因：

一個原因是父子行程寫同一個檔案必然會產生競爭問題，控制競爭就意味著會影響父進程的效能。
如果 AOF 重寫過程中失敗了，那麼原本的 AOF 檔案就相當於被污染了，無法做恢復使用。所以 Redis AOF 重寫一個新文件，重寫失敗的話，直接刪除這個文件就好了，不會對原先的 AOF 文件產生影響。等重寫完成之後，直接取代舊文件即可。