阿里二面：熟悉Redis？講講你理解的Redis的持久化機制(RDB、AOF)

2020-02-15 08:56:00 JavaSpring高級進階

1. 為什麼需要持久化？

因為Redis是內存數據庫，它將自己的數據存儲在內存裡面，一旦Redis服務器進程退出或者運行Redis服務器的計算機停機，Redis服務器中的數據就會丟失。

為了避免數據丟失，所以Redis提供了持久化機制，將存儲在內存中的數據保存到磁盤中，用於在Redis服務器進程退出或者運行Redis服務器的計算機停機導致數據丟失時，快速的恢復之前Redis存儲在內存中的數據。

Redis提供了2種持久化方式，分別為：

RDB持久化
AOF持久化

接下來，我們一一詳解。

2. RDB持久化

RDB持久化是將某個時間點上Redis中的數據保存到一個RDB文件中，如下所示：

基於RDB持久化的上述性質，所以RDB持久化也叫做快照持久化。

該文件是一個經過壓縮的二進制文件，通過該文件可以還原生成RDB文件時Redis中的數據，如下所示：

2.1 創建RDB文件

Redis提供了2個命令來創建RDB文件，一個是SAVE，另一個是BGSAVE。

SAVE命令會阻塞Redis服務器進程，直到RDB文件創建完畢為止，在服務器進程阻塞期間，服務器不能處理任何命令請求，如下所示：

BGSAVE命令會派生出一個子進程，然後由子進程負責創建RDB文件，服務器進程（父進程）繼續處理命令請求，如下所示：

以上描述也是這２個命令的區別，這裡是重點，面試經常會問到。

因為BGSAVE命令可以在不阻塞服務器進程的情況下執行，所以推薦使用BGSAVE命令。

我們可以手動執行該命令，如上面截圖所示，但還是推薦設置下Redis服務器配置文件的save選項，讓服務器每隔一段時間自動執行一次BGSAVE命令。

我們可以通過save選項設置多個保存條件，只要其中任意一個條件被滿足，服務器就會執行BGSAVE命令。

save選項設置的默認條件如下所示：

save 900 1

save 300 10

save 60 10000

默認的配置條件表示，只要滿足以下3個條件中的任意1個，BGSAVE命令就會被執行：

服務器在900s（即15分鐘）之內，對數據庫進行了至少1次修改
服務器在300s（即5分鐘）之內，對數據庫進行了至少10次修改
服務器在60s（即1分鐘）之內，對數據庫進行了至少10000次修改

當滿足條件執行BGSAVE命令時，輸出日誌如下圖所示：

生成的RDB文件會根據Redis配置文件中的名稱和路徑來保存，相關的2個配置如下所示：

最終生成的RDB文件如下所示（截圖為本機Windows環境，Linux環境下路徑會稍有不同）：

2.2 載入RDB文件

首先，我們要明確的是，載入RDB文件的目的是為了在Redis服務器進程重新啟動之後還原之前存儲在Redis中的數據。

然後，Redis載入RDB文件並沒有專門的命令，而是在Redis服務器啟動時自動執行的。

而且，Redis服務器啟動時是否會載入RDB文件還取決於服務器是否啟用了AOF持久化功能，具體判斷邏輯為：

只有在AOF持久化功能處於關閉狀態時，服務器才會使用RDB文件來還原數據。
如果服務器開啟了AOF持久化功能，那麼服務器會優先使用AOF文件來還原數據。

以上判斷邏輯如下圖所示：

默認情況下，Redis服務器的AOF持久化功能是關閉的，所以Redis服務器在啟動時會載入RDB文件，

啟動日誌如下所示：

2.3 服務器狀態

創建和載入RDB文件，可能存在的服務器狀態有以下3種：

當執行SAVE命令時，Redis服務器會被阻塞，此時客戶端發送的所有命令請求都會被阻塞，只有在服務器執行完SAVE命令，重新開始接受命令請求之後，客戶端發送的命令請求才會被處理。
當執行BGSAVE命令時，Redis服務器不會被阻塞，Redis服務器仍然可以繼續處理客戶端發送的命令請求。
服務器在載入RDB文件期間，會一直處於阻塞狀態，直到RDB文件載入成功。

3. AOF持久化

AOF持久化是通過保存Redis服務器所執行的寫命令來記錄數據庫數據的，如下圖所示：

默認情況下，AOF持久化功能是關閉的，如果想要打開，可以修改下圖所示的配置：

舉個例子，假設Redis中還沒有存儲任何數據，我們執行了如下所示的命令：

然後我們會發現Redis服務器生成了1個名為appendonly.aof的文件，打開該文件，我們可以看到上面執行的3個寫命令都存儲在該文件中：

3.1 AOF持久化的實現

當AOF持久化功能處於打開狀態時，Redis服務器在執行完一個寫命令之後，會以協議格式（如上面截圖中AOF文件裡保存寫命令的格式）將被執行的寫命令追加到服務器狀態的AOF緩衝區的末尾，然後Redis服務器會根據配置文件中appendfsync選項的值來決定何時將AOF緩衝區中的內容寫入和同步到AOF文件裡面。

appendfsync選項有以下3個值：

always 從安全性來說，always是最安全的（丟失數據最少），因為即使出現故障停機，數據庫也只會丟失一個事件循環中所產生的命令數據。從效率來說，always的效率最慢，因為服務器在每個事件循環都要將AOF緩衝區中的所有內容寫入到AOF文件，並且同步AOF文件。
everysec 從安全性來說，everysec模式下，即使出現故障停機，數據庫只會丟失一秒鐘的命令數據。從效率來說，everysec模式足夠快，因為服務器在每個事件循環都要將AOF緩衝區中的所有內容寫入到AOF文件，並且每隔一秒就要在子線程中對AOF文件進行同步。
no 從安全性來說，no模式下，如果出現故障停機，數據庫會丟失上次同步AOF文件之後的所有寫命令數據，具有不確定性，因為服務器在每個事件循環都要將AOF緩衝區中的所有內容寫入到AOF文件，至於何時對AOF文件進行同步，則由操作系統控制。從效率來說，no模式和everysec模式的效率差不多。

appendfsync選項的默認值是everysec，也推薦使用這個值，因為既保證了效率又保證了安全性。

3.2 載入AOF文件

因為AOF文件包含了重建數據庫所需的所有寫命令，所以Redis服務器只要讀入並重新執行一遍AOF文件裡面保存的寫命令，就可以還原Redis服務器關閉之前的數據。

Redis讀取AOF文件並還原數據庫的詳細步驟如下：

創建一個不帶網絡連接的偽客戶端因為Redis的命令只能在客戶端上下文中執行，而載入AOF文件時所使用的命令直接來源於AOF文件而不是網絡連接，所以服務器使用了一個沒有網絡連接的偽客戶端來執行AOF文件保存的寫命令。偽客戶端執行命令的效果和帶網絡連接的客戶端執行命令的效果完全一樣。
從AOF文件中分析並讀取出一條寫命令。
使用偽客戶端執行被讀取出的寫命令。
一直執行步驟2和步驟3，直到AOF文件中的所有寫命令都被執行完畢。

以上步驟如下圖所示：

如果Redis服務器開啟了AOF持久化功能，那麼Redis服務器在啟動時會載入AOF文件，

啟動日誌如下所示：

3.3 AOF重寫

因為AOF持久化是通過保存被執行的寫命令來記錄數據庫數據的，所以隨著Redis服務器運行時間的增加，AOF文件中的內容會越來越多，文件的體積會越來越大，如果不做控制，會有以下2點壞處：

過多的佔用服務器磁盤空間，可能會對Redis服務器甚至整個宿主計算機造成影響。
AOF文件的體積越大，使用AOF文件來進行數據庫還原所需的時間就越多。

舉個例子，在客戶端執行如下命令：

為了記錄這個list鍵的狀態，AOF文件就需要保存上面執行的6條命令。

為了解決AO文件體積越來越大的問題，Redis提供了AOF文件重寫功能，即Redis服務器會創建一個新的AOF文件來替代現有的AOF文件，新舊兩個AOF文件所保存的數據庫數據相同，但新AOF文件不會包含任何浪費空間的冗餘命令，所以新AOF文件的體積通常會比舊AOF文件的體積要小很多。

3.3.1 AOF重寫的實現原理

AOF文件重寫並不需要對現有的AOF文件進行任何讀取、分析或者寫入操作，而是通過讀取服務器當前的數據庫數據來實現的。

仍然以上面的list鍵為例，舊的AOF文件保存了6條命令來記錄list鍵的狀態，但list鍵的結果是“C” "D" "E" "F" "G"這樣的數據，所以AOF文件重寫時，可以用一條RPUSH list “C” "D" "E" "F" "G"命令來代替之前的六條命令，這樣就可以將保存list鍵所需的命令從六條減少為一條了。

按照上面的原理，如果Redis服務器存儲的鍵值對足夠多，AOF文件重寫生成的新AOF文件就會減少很多很多的冗餘命令，進而大大減小了AOF文件的體積。

綜上所述，AOF文件重寫功能的實現原理為：

首先從數據庫中讀取鍵現在的值，然後用一條命令去記錄鍵值對，代替之前記錄這個鍵值對的多條命令。

3.3.2 AOF後臺重寫

因為AOF文件重寫會進行大量的文件寫入操作，所以執行這個操作的線程將被長時間阻塞。

因為Redis服務器使用單個線程來處理命令請求，所以如果由服務器進程直接執行這個操作，那麼在重寫AOF文件期間，服務器將無法處理客戶端發送過來的命令請求。

為了避免上述問題，Redis將AOF文件重寫功能放到子進程裡執行，這樣做有以下2個好處：

子進程進行AOF文件重寫期間，服務器進程（父進程）可以繼續處理命令請求。
子進程帶有服務器進程的數據副本，使用子進程而不是線程，可以在避免使用鎖的情況下，保證數據的安全性。

AOF後臺重寫的步驟如下所示：

服務器進程創建子進程，子進程開始AOF文件重寫
從創建子進程開始，服務器進程執行的所有寫命令不僅要寫入AOF緩衝區，還要寫入AOF重寫緩衝區寫入AOF緩衝區的目的是為了同步到原有的AOF文件。寫入AOF重寫緩衝區的目的是因為子進程在進行AOF文件重寫期間，服務器進程還在繼續處理命令請求，而新的命令可能會對現有的數據庫進行修改，從而使得服務器當前的數據庫數據和重寫後的AOF文件所保存的數據庫數據不一致。
子進程完成AOF重寫工作，向父進程發送一個信號，父進程在接收到該信號後，會執行以下操作： 1.將AOF重寫緩衝區中的所有內容寫入到新AOF文件中，這樣就保證了新AOF文件所保存的數據庫數據和服務器當前的數據庫數據是一致的。 2.對新的AOF文件進行改名，原子地覆蓋現有的AOF文件，完成新舊兩個AOF文件的替換。

Redis提供了BGREWRITEAOF命令來執行以上步驟，如下圖所示：

執行完成後，打開appendonly.aof文件，發現保存list鍵的命令從六條變為了一條：

除了手動執行BGREWRITEAOF命令外，Redis還提供了2個配置項用來自動執行BGREWRITEAOF命令：

auto-aof-rewrite-percentage 100

auto-aof-rewrite-min-size 64mb

該配置表示，當AOF文件的體積大於64MB，並且AOF文件的體積比上一次重寫之後的體積大了至少一倍（100%），Redis將自動執行BGREWRITEAOF命令。

4. RDB持久化、AOF持久化的區別

通過上面的講解，我們會發現Redis提供的2種持久化方法是有區別的，可以總結為以下4點：

實現方式
文件體積
安全性
優先級

接下來一一講解。

4.1 實現方式

RDB持久化是通過將某個時間點Redis服務器存儲的數據保存到RDB文件中來實現持久化的。

AOF持久化是通過將Redis服務器執行的所有寫命令保存到AOF文件中來實現持久化的。

4.2 文件體積

由上述實現方式可知，RDB持久化記錄的是結果，AOF持久化記錄的是過程，所以AOF持久化生成的AOF文件會有體積越來越大的問題，Redis提供了AOF重寫功能來減小AOF文件體積。

4.3 安全性

AOF持久化的安全性要比RDB持久化的安全性高，即如果發生機器故障，AOF持久化要比RDB持久化丟失的數據要少。

因為RDB持久化會丟失上次RDB持久化後寫入的數據，而AOF持久化最多丟失1s之內寫入的數據（使用默認everysec配置的話）。

4.4 優先級

由於上述的安全性問題，如果Redis服務器開啟了AOF持久化功能，Redis服務器在啟動時會使用AOF文件來還原數據，如果Redis服務器沒有開啟AOF持久化功能，Redis服務器在啟動時會使用RDB文件來還原數據，所以AOF文件的優先級比RDB文件的優先級高。

作者：申城異鄉人
鏈接：https://juejin.im/post/5e426906f265da571c4c8a49

分享到:

閱讀更多 JavaSpring高級進階 的文章

關鍵字: Redis 所示電腦

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"