阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

什麼是Redis及其重要性?

Redis是一個使用ANSI C編寫的開源、支持網絡、基於內存、可選持久化的高性能鍵值對數據庫。

Redis的之父是來自意大利的西西里島的Salvatore Sanfilippo,Github網名antirez,筆者找了作者的一些簡要信息並翻譯了一下,如圖:

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

從2009年第一個版本起Redis已經走過了10個年頭,目前Redis仍然是最流行的key-value型內存數據庫的之一。

優秀的開源項目離不開大公司的支持,在2013年5月之前,其開發由VMware贊助,而2013年5月至2015年6月期間,其開發由畢威拓贊助,從2015年6月開始,Redis的開發由Redis Labs贊助。

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

筆者也使用過一些其他的NoSQL,有的支持的value類型非常單一,因此很多操作都必須在客戶端實現,比如value是一個結構化的數據,需要修改其中某個字段就需要整體讀出來修改再整體寫入,顯得很笨重,但是Redis的value支持多種類型,實現了很多操作在服務端就可以完成了,這個對客戶端而言非常方便。

當然Redis由於是內存型的數據庫,數據量存儲量有限而且分佈式集群成本也會非常高,因此有很多公司開發了基於SSD的類Redis系統,比如360開發的SSDB、Pika等數據庫,但是筆者認為從0到1的難度是大於從1到2的難度的,毋庸置疑Redis是NoSQL中濃墨重彩的一筆,值得我們去深入研究和使用。

Redis提供了Java、C/C++、C#、 PHP 、JavaScript、 Perl 、Object-C、Python、Ruby、Erlang、Golang等多種主流語言的客戶端,因此無論使用者是什麼語言棧總會找到屬於自己的那款客戶端,受眾非常廣。

筆者查了datanyze.com網站看了下Redis和MySQL的最新市場份額和排名對比以及全球Top站點的部署量對比(網站數據2019.12):

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

可以看到Redis總體份額排名第9並且在全球Top100站點中部署數量與MySQL基本持平,所以Redis還是有一定的江湖地位的。

簡述Redis常用的數據結構及其如何實現的?

Redis支持的常用5種數據類型指的是value類型,分別為:字符串String、列表List、哈希Hash、集合Set、有序集合Zset,但是Redis後續又豐富了幾種數據類型分別是Bitmaps、HyperLogLogs、GEO。

由於Redis是基於標準C寫的,只有最基礎的數據類型,因此Redis為了滿足對外使用的5種數據類型,開發了屬於自己獨有的一套基礎數據結構,使用這些數據結構來實現5種數據類型。

Redis底層的數據結構包括:簡單動態數組SDS、鏈表、字典、跳躍鏈表、整數集合、壓縮列表、對象。

Redis為了平衡空間和時間效率,針對value的具體類型在底層會採用不同的數據結構來實現,其中哈希表和壓縮列表是複用比較多的數據結構,如下圖展示了對外數據類型和底層數據結構之間的映射關係:

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

從圖中可以看到ziplist壓縮列表可以作為Zset、Set、List三種數據類型的底層實現,看來很強大,壓縮列表是一種為了節約內存而開發的且經過特殊編碼之後的連續內存塊順序型數據結構,底層結構還是比較複雜的。

Redis的SDS和C中字符串相比有什麼優勢?

在C語言中使用N+1長度的字符數組來表示字符串,尾部使用'\\0'作為結尾標誌,對於此種實現無法滿足Redis對於安全性、效率、豐富的功能的要求,因此Redis單獨封裝了SDS簡單動態字符串結構。

在理解SDS的優勢之前需要先看下SDS的實現細節,找了github最新的src/sds.h的定義看下:

<code>typedef char *sds;/*這個用不到 忽略即可*/struct __attribute__ ((__packed__)) sdshdr5 {    unsigned char flags; /* 3 lsb of type, and 5 msb of string length */    char buf[];};/*不同長度的header 8 16 32 64共4種 都給出了四個成員len:當前使用的空間大小;alloc去掉header和結尾空字符的最大空間大小flags:8位的標記 下面關於SDS_TYPE_x的宏定義只有5種 3bit足夠了 5bit沒有用buf:這個跟C語言中的字符數組是一樣的,從typedef char* sds可以知道就是這樣的。buf的最大長度是2^n 其中n為sdshdr的類型,如當選擇sdshdr16,buf_max=2^16。*/struct __attribute__ ((__packed__)) sdshdr8 {    uint8_t len; /* used */    uint8_t alloc; /* excluding the header and null terminator */    unsigned char flags; /* 3 lsb of type, 5 unused bits */    char buf[];};struct __attribute__ ((__packed__)) sdshdr16 {    uint16_t len; /* used */    uint16_t alloc; /* excluding the header and null terminator */    unsigned char flags; /* 3 lsb of type, 5 unused bits */    char buf[];};struct __attribute__ ((__packed__)) sdshdr32 {    uint32_t len; /* used */    uint32_t alloc; /* excluding the header and null terminator */    unsigned char flags; /* 3 lsb of type, 5 unused bits */    char buf[];};struct __attribute__ ((__packed__)) sdshdr64 {    uint64_t len; /* used */    uint64_t alloc; /* excluding the header and null terminator */    unsigned char flags; /* 3 lsb of type, 5 unused bits */    char buf[];};#define SDS_TYPE_5  0#define SDS_TYPE_8  1#define SDS_TYPE_16 2#define SDS_TYPE_32 3#define SDS_TYPE_64 4#define SDS_TYPE_MASK 7#define SDS_TYPE_BITS 3複製代碼/<code>


看了前面的定義,筆者畫了個圖:

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

從圖中可以知道sds本質分為三部分:header、buf、null結尾符,其中header可以認為是整個sds的指引部分,給定了使用的空間大小、最大分配大小等信息,再用一張網上的圖來清晰看下sdshdr8的實例:


阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

在sds.h/sds.c源碼中可清楚地看到sds完整的實現細節,本文就不展開了要不然篇幅就過長了,快速進入主題說下sds的優勢:

  • O(1)獲取長度: C字符串需要遍歷而sds中有len可以直接獲得;
  • 防止緩衝區溢出bufferoverflow: 當sds需要對字符串進行修改時,首先借助於len和alloc檢查空間是否滿足修改所需的要求,如果空間不夠的話,SDS會自動擴展空間,避免了像C字符串操作中的覆蓋情況;
  • 有效降低內存分配次數:C字符串在涉及增加或者清除操作時會改變底層數組的大小造成重新分配、sds使用了空間預分配和惰性空間釋放機制,說白了就是每次在擴展時是成倍的多分配的,在縮容是也是先留著並不正式歸還給OS,這兩個機制也是比較好理解的;
  • 二進制安全:C語言字符串只能保存ascii碼,對於圖片、音頻等信息無法保存,sds是二進制安全的,寫入什麼讀取就是什麼,不做任何過濾和限制;

老規矩上一張黃健宏大神總結好的圖:

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

Redis的字典是如何實現的?簡述漸進式rehash過程

字典算是Redis中常用數據類型中的明星成員了,前面說過字典可以基於ziplist和hashtable來實現,我們只討論基於hashtable實現的原理。

字典是個層次非常明顯的數據類型,如圖:

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

有了個大概的概念,我們看下最新的src/dict.h源碼定義:

<code>//哈希節點結構typedef struct dictEntry {    void *key;    union {        void *val;        uint64_t u64;        int64_t s64;        double d;    } v;    struct dictEntry *next;} dictEntry;//封裝的是字典的操作函數指針typedef struct dictType {    uint64_t (*hashFunction)(const void *key);    void *(*keyDup)(void *privdata, const void *key);    void *(*valDup)(void *privdata, const void *obj);    int (*keyCompare)(void *privdata, const void *key1, const void *key2);    void (*keyDestructor)(void *privdata, void *key);    void (*valDestructor)(void *privdata, void *obj);} dictType;/* This is our hash table structure. Every dictionary has two of this as we * implement incremental rehashing, for the old to the new table. *///哈希表結構 該部分是理解字典的關鍵typedef struct dictht {    dictEntry **table;    unsigned long size;    unsigned long sizemask;    unsigned long used;} dictht;//字典結構typedef struct dict {    dictType *type;    void *privdata;    dictht ht[2];    long rehashidx; /* rehashing not in progress if rehashidx == -1 */    unsigned long iterators; /* number of iterators currently running */} dict;複製代碼/<code>


C語言的好處在於定義必須是由最底層向外的,因此我們可以看到一個明顯的層次變化,於是筆者又畫一圖來展現具體的層次概念:

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

  • 關於dictEntry

dictEntry是哈希表節點,也就是我們存儲數據地方,其保護的成員有:key,v,next指針。key保存著鍵值對中的鍵,v保存著鍵值對中的值,值可以是一個指針或者是uint64_t或者是int64_t。next是指向另一個哈希表節點的指針,這個指針可以將多個哈希值相同的鍵值對連接在一次,以此來解決哈希衝突的問題。

如圖為兩個衝突的哈希節點的連接關係:


阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

  • 關於dictht

從源碼看哈希表包括的成員有table、size、used、sizemask。table是一個數組,數組中的每個元素都是一個指向dictEntry結構的指針, 每個dictEntry結構保存著一個鍵值對;size 屬性記錄了哈希表table的大小,而used屬性則記錄了哈希表目前已有節點的數量。sizemask等於size-1和哈希值計算一個鍵在table數組的索引,也就是計算index時用到的。

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

如上圖展示了一個大小為4的table中的哈希節點情況,其中k1和k0在index=2發生了哈希衝突,進行開鏈表存在,本質上是先存儲的k0,k1放置是發生衝突為了保證效率直接放在衝突鏈表的最前面,因為該鏈表沒有尾指針。

  • 關於dict

從源碼中看到dict結構體就是字典的定義,包含的成員有type,privdata、ht、rehashidx。其中dictType指針類型的type指向了操作字典的api,理解為函數指針即可,ht是包含2個dictht的數組,也就是字典包含了2個哈希表,rehashidx進行rehash時使用的變量,privdata配合dictType指向的函數作為參數使用,這樣就對字典的幾個成員有了初步的認識。

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

字典的哈希算法

<code>//偽碼:使用哈希函數,計算鍵key的哈希值hash = dict->type->hashFunction(key);//偽碼:使用哈希表的sizemask和哈希值,計算出在ht[0]或許ht[1]的索引值index = hash & dict->ht[x].sizemask;//源碼定義#define dictHashKey(d, key) (d)->type->hashFunction(key)複製代碼/<code>

redis使用MurmurHash算法計算哈希值,該算法最初由Austin Appleby在2008年發明,MurmurHash算法的無論數據輸入情況如何都可以給出隨機分佈性較好的哈希值並且計算速度非常快,目前有MurmurHash2和MurmurHash3等版本。

  • 普通Rehash重新散列

哈希表保存的鍵值對數量是動態變化的,為了讓哈希表的負載因子維持在一個合理的範圍之內,就需要對哈希表進行擴縮容。

擴縮容是通過執行rehash重新散列來完成,對字典的哈希表執行普通rehash的基本步驟為分配空間->逐個遷移->交換哈希表,詳細過程如下:

  1. 為字典的ht[1]哈希表分配空間,分配的空間大小取決於要執行的操作以及ht[0]當前包含的鍵值對數量:擴展操作時ht[1]的大小為第一個大於等於ht[0].used*2的2^n;收縮操作時ht[1]的大小為第一個大於等於ht[0].used的2^n ;
    擴展時比如h[0].used=200,那麼需要選擇大於400的第一個2的冪,也就是2^9=512。
  2. 將保存在ht[0]中的所有鍵值對重新計算鍵的哈希值和索引值rehash到ht[1]上;
  3. 重複rehash直到ht[0]包含的所有鍵值對全部遷移到了ht[1]之後釋放 ht[0], 將ht[1]設置為 ht[0],並在ht[1]新創建一個空白哈希表, 為下一次rehash做準備。
  • 漸進Rehash過程

Redis的rehash動作並不是一次性完成的,而是分多次、漸進式地完成的,原因在於當哈希表裡保存的鍵值對數量很大時, 一次性將這些鍵值對全部rehash到ht[1]可能會導致服務器在一段時間內停止服務,這個是無法接受的。

針對這種情況Redis採用了漸進式rehash,過程的詳細步驟:

  1. 為ht[1]分配空間,這個過程和普通Rehash沒有區別;
  2. 將rehashidx設置為0,表示rehash工作正式開始,同時這個rehashidx是遞增的,從0開始表示從數組第一個元素開始rehash。
  3. 在rehash進行期間,每次對字典執行增刪改查操作時,順帶將ht[0]哈希表在rehashidx索引上的鍵值對rehash到 ht[1],完成後將rehashidx加1,指向下一個需要rehash的鍵值對。
  4. 隨著字典操作的不斷執行,最終ht[0]的所有鍵值對都會被rehash至ht[1],再將rehashidx屬性的值設為-1來表示 rehash操作已完成。

漸進式 rehash的思想在於將rehash鍵值對所需的計算工作分散到對字典的每個添加、刪除、查找和更新操作上,從而避免了集中式rehash而帶來的阻塞問題

看到這裡不禁去想這種捎帶腳式的rehash會不會導致整個過程非常漫長?如果某個value一直沒有操作那麼需要擴容時由於一直不用所以影響不大,需要縮容時如果一直不處理可能造成內存浪費,具體的還沒來得及研究,先埋個問題吧

講講4.0之前版本的Redis的單線程運行模式

本質上Redis並不是單純的單線程服務模型,一些輔助工作比如持久化刷盤、惰性刪除等任務是由BIO線程來完成的,這裡說的單線程主要是說與客戶端交互完成命令請求和回覆的工作線程。

至於Antirez大佬當時是怎麼想的設計為單線程不得而知,只能從幾個角度來分析,來確定單線程模型的選擇原因。

50道Redis面試題史上最全,以後面試再也不怕問Redis了

1、什麼是Redis?

Redis本質上是一個Key-Value類型的內存數據庫,很像memcached,整個數據庫統統加載在內存當中進行操作,定期通過異步操作把數據庫數據flush到硬盤上進行保存。因為是純內存操作,Redis的性能非常出色,每秒可以處理超過 10萬次讀寫操作,是已知性能最快的Key-Value DB。 Redis的出色之處不僅僅是性能,Redis最大的魅力是支持保存多種數據結構,此外單個value的最大限制是1GB,不像 memcached只能保存1MB的數據,因此Redis可以用來實現很多有用的功能,比方說用他的List來做FIFO雙向鏈表,實現一個輕量級的高性 能消息隊列服務,用他的Set可以做高性能的tag系統等等。另外Redis也可以對存入的Key-Value設置expire時間,因此也可以被當作一 個功能加強版的memcached來用。 Redis的主要缺點是數據庫容量受到物理內存的限制,不能用作海量數據的高性能讀寫,因此Redis適合的場景主要侷限在較小數據量的高性能操作和運算上。

2、Redis相比memcached有哪些優勢?

(1) memcached所有的值均是簡單的字符串,redis作為其替代者, 支持更為豐富的數據類型

(2) redis的速度比memcached快很多

(3) redis可以持久化其數據

3、Redis支持哪幾種數據類型?

String、List、Set、Sorted Set、hashes

4、Redis主要消耗什麼物理資源?

redis是一種基於內存高性能的數據庫--- 主要依賴於內存內存。

5、Redis的全稱是什麼?

Remote Dictionary Server

6、Redis有哪幾種數據淘汰策略?

noeviction:返回錯誤當內存限制達到並且客戶端嘗試執行會讓更多內存被使用的命令(大部分的寫入指令,但DEL和幾個例外)allkeys-lru: 嘗試回收最少使用的鍵(LRU),使得新添加的數據有空間存放。volatile-lru: 嘗試回收最少使用的鍵(LRU),但僅限於在過期集合的鍵,使得新添加的數據有空間存放。allkeys-random: 回收隨機的鍵使得新添加的數據有空間存放。volatile-random: 回收隨機的鍵使得新添加的數據有空間存放,但僅限於在過期集合的鍵。volatile-ttl: 回收在過期集合的鍵,並且優先回收存活時間(TTL)較短的鍵,使得新添加的數據有空間存放。

7、Redis官方為什麼不提供Windows版本?

因為目前Linux版本已經相當穩定,而且用戶量很大,無需開發windows版本,反而會帶來兼容性等問題。

8、一個字符串類型的值能存儲最大容量是多少?

512M

9、為什麼Redis需要把所有數據放到內存中?

Redis為了達到最快的讀寫速度將數據都讀到內存中,並通過異步的方式將數據寫入磁盤。所以redis具有快速和數據持久化的特徵。如果不將數據放在內存中,磁盤I/O速度為嚴重影響redis的性能。在內存越來越便宜的今天,redis將會越來越受歡迎。

如果設置了最大使用的內存,則數據已有記錄數達到內存限值後不能繼續插入新值。

10、Redis集群方案應該怎麼做?都有哪些方案?

1.twemproxy,大概概念是,它類似於一個代理方式,使用方法和普通redis無任何區別,設置好它下屬的多個redis實例後,使用時在本需要連接redis的地方改為連接twemproxy,它會以一個代理的身份接收請求並使用一致性hash算法,將請求轉接到具體redis,將結果再返回twemproxy。使用方式簡便(相對redis只需修改連接端口),對舊項目擴展的首選。 問題:twemproxy自身單端口實例的壓力,使用一致性hash後,對redis節點數量改變時候的計算值的改變,數據無法自動移動到新的節點。

2.codis,目前用的最多的集群方案,基本和twemproxy一致的效果,但它支持在 節點數量改變情況下,舊節點數據可恢復到新hash節點。

3.redis cluster3.0自帶的集群,特點在於他的分佈式算法不是一致性hash,而是hash槽的概念,以及自身支持節點設置從節點。具體看官方文檔介紹。

4.在業務代碼層實現,起幾個毫無關聯的redis實例,在代碼層,對key 進行hash計算,然後去對應的redis實例操作數據。 這種方式對hash層代碼要求比較高,考慮部分包括,節點失效後的替代算法方案,數據震盪後的自動腳本恢復,實例的監控,等等。

11、Redis集群方案什麼情況下會導致整個集群不可用?

有A,B,C三個節點的集群,在沒有複製模型的情況下,如果節點B失敗了,那麼整個集群就會以為缺少5501-11000這個範圍的槽而不可用。

12、MySQL裡有2000w數據,redis中只存20w的數據,如何保證redis中的數據都是熱點數據?

redis內存數據集大小上升到一定大小的時候,就會施行數據淘汰策略。

13、Redis有哪些適合的場景?

(1)、會話緩存(Session Cache)最常用的一種使用Redis的情景是會話緩存(session cache)。用Redis緩存會話比其他存儲(如Memcached)的優勢在於:Redis提供持久化。當維護一個不是嚴格要求一致性的緩存時,如果用戶的購物車信息全部丟失,大部分人都會不高興的,現在,他們還會這樣嗎?幸運的是,隨著 Redis 這些年的改進,很容易找到怎麼恰當的使用Redis來緩存會話的文檔。甚至廣為人知的商業平臺Magento也提供Redis的插件。

(2)、全頁緩存(FPC)除基本的會話token之外,Redis還提供很簡便的FPC平臺。回到一致性問題,即使重啟了Redis實例,因為有磁盤的持久化,用戶也不會看到頁面加載速度的下降,這是一個極大改進,類似PHP本地FPC。再次以Magento為例,Magento提供一個插件來使用Redis作為全頁緩存後端。此外,對WordPress的用戶來說,Pantheon有一個非常好的插件 wp-redis,這個插件能幫助你以最快速度加載你曾瀏覽過的頁面。

(3)、隊列Reids在內存存儲引擎領域的一大優點是提供 list 和 set 操作,這使得Redis能作為一個很好的消息隊列平臺來使用。Redis作為隊列使用的操作,就類似於本地程序語言(如Python)對 list 的 push/pop 操作。如果你快速的在Google中搜索“Redis queues”,你馬上就能找到大量的開源項目,這些項目的目的就是利用Redis創建非常好的後端工具,以滿足各種隊列需求。例如,Celery有一個後臺就是使用Redis作為broker,你可以從這裡去查看。

(4),排行榜/計數器Redis在內存中對數字進行遞增或遞減的操作實現的非常好。集合(Set)和有序集合(Sorted Set)也使得我們在執行這些操作的時候變的非常簡單,Redis只是正好提供了這兩種數據結構。所以,我們要從排序集合中獲取到排名最靠前的10個用戶–我們稱之為“user_scores”,我們只需要像下面一樣執行即可:當然,這是假定你是根據你用戶的分數做遞增的排序。如果你想返回用戶及用戶的分數,你需要這樣執行:ZRANGE user_scores 0 10 WITHSCORESAgora Games就是一個很好的例子,用Ruby實現的,它的排行榜就是使用Redis來存儲數據的,你可以在這裡看到。

(5)、發佈/訂閱最後(但肯定不是最不重要的)是Redis的發佈/訂閱功能。發佈/訂閱的使用場景確實非常多。我已看見人們在社交網絡連接中使用,還可作為基於發佈/訂閱的腳本觸發器,甚至用Redis的發佈/訂閱功能來建立聊天系統!(不,這是真的,你可以去核實)。

14、Redis支持的Java客戶端都有哪些?官方推薦用哪個?

Redisson、Jedis、lettuce等等,官方推薦使用Redisson。

15、Redis和Redisson有什麼關係?

Redisson是一個高級的分佈式協調Redis客服端,能幫助用戶在分佈式環境中輕鬆實現一些Java的對象 (Bloom filter, BitSet, Set, SetMultimap, ScoredSortedSet, SortedSet, Map, ConcurrentMap, List, ListMultimap, Queue, BlockingQueue, Deque, BlockingDeque, Semaphore, Lock, ReadWriteLock, AtomicLong, CountDownLatch, Publish / Subscribe, HyperLogLog)。

16、Jedis與Redisson對比有什麼優缺點?

Jedis是Redis的Java實現的客戶端,其API提供了比較全面的Redis命令的支持;Redisson實現了分佈式和可擴展的Java數據結構,和Jedis相比,功能較為簡單,不支持字符串操作,不支持排序、事務、管道、分區等Redis特性。Redisson的宗旨是促進使用者對Redis的關注分離,從而讓使用者能夠將精力更集中地放在處理業務邏輯上。

17、Redis如何設置密碼及驗證密碼?

設置密碼:config set requirepass 123456授權密碼:auth 123456

18、說說Redis哈希槽的概念?

Redis集群沒有使用一致性hash,而是引入了哈希槽的概念,Redis集群有16384個哈希槽,每個key通過CRC16校驗後對16384取模來決定放置哪個槽,集群的每個節點負責一部分hash槽。

19、Redis集群的主從複製模型是怎樣的?

為了使在部分節點失敗或者大部分節點無法通信的情況下集群仍然可用,所以集群使用了主從複製模型,每個節點都會有N-1個複製品.

20、Redis集群會有寫操作丟失嗎?為什麼?

Redis並不能保證數據的強一致性,這意味這在實際中集群在特定的條件下可能會丟失寫操作。

21、Redis集群之間是如何複製的?

異步複製

22、Redis集群最大節點個數是多少?

16384個。

23、Redis集群如何選擇數據庫?

Redis集群目前無法做數據庫選擇,默認在0數據庫。

24、怎麼測試Redis的連通性?

ping

25、Redis中的管道有什麼用?

一次請求/響應服務器能實現處理新的請求即使舊的請求還未被響應。這樣就可以將多個命令發送到服務器,而不用等待回覆,最後在一個步驟中讀取該答覆。這就是管道(pipelining),是一種幾十年來廣泛使用的技術。例如許多POP3協議已經實現支持這個功能,大大加快了從服務器下載新郵件的過程。

26、怎麼理解Redis事務?

事務是一個單獨的隔離操作:事務中的所有命令都會序列化、按順序地執行。事務在執行的過程中,不會被其他客戶端發送來的命令請求所打斷。事務是一個原子操作:事務中的命令要麼全部被執行,要麼全部都不執行。

27、Redis事務相關的命令有哪幾個?

MULTI、EXEC、DISCARD、WATCH ##28、Redis key的過期時間和永久有效分別怎麼設置? EXPIRE和PERSIST命令。

29、Redis如何做內存優化?

儘可能使用散列表(hashes),散列表(是說散列表裡面存儲的數少)使用的內存非常小,所以你應該儘可能的將你的數據模型抽象到一個散列表裡面。比如你的web系統中有一個用戶對象,不要為這個用戶的名稱,姓氏,郵箱,密碼設置單獨的key,而是應該把這個用戶的所有信息存儲到一張散列表裡面.

30、Redis回收進程如何工作的?

一個客戶端運行了新的命令,添加了新的數據。Redi檢查內存使用情況,如果大於maxmemory的限制, 則根據設定好的策略進行回收。一個新的命令被執行,等等。所以我們不斷地穿越內存限制的邊界,通過不斷達到邊界然後不斷地回收回到邊界以下。如果一個命令的結果導致大量內存被使用(例如很大的集合的交集保存到一個新的鍵),不用多久內存限制就會被這個內存使用量超越。**

31、Redis回收使用的是什麼算法?

**LRU算法

32、Redis如何做大量數據插入?

Redis2.6開始redis-cli支持一種新的被稱之為pipe mode的新模式用於執行大量數據插入工作。

33、為什麼要做Redis分區?

分區可以讓Redis管理更大的內存,Redis將可以使用所有機器的內存。如果沒有分區,你最多隻能使用一臺機器的內存。分區使Redis的計算能力通過簡單地增加計算機得到成倍提升,Redis的網絡帶寬也會隨著計算機和網卡的增加而成倍增長。

34、你知道有哪些Redis分區實現方案?

客戶端分區就是在客戶端就已經決定數據會被存儲到哪個redis節點或者從哪個redis節點讀取。大多數客戶端已經實現了客戶端分區。代理分區 意味著客戶端將請求發送給代理,然後代理決定去哪個節點寫數據或者讀數據。代理根據分區規則決定請求哪些Redis實例,然後根據Redis的響應結果返回給客戶端。redis和memcached的一種代理實現就是Twemproxy查詢路由(Query routing) 的意思是客戶端隨機地請求任意一個redis實例,然後由Redis將請求轉發給正確的Redis節點。Redis Cluster實現了一種混合形式的查詢路由,但並不是直接將請求從一個redis節點轉發到另一個redis節點,而是在客戶端的幫助下直接redirected到正確的redis節點。

35、Redis分區有什麼缺點?

涉及多個key的操作通常不會被支持。例如你不能對兩個集合求交集,因為他們可能被存儲到不同的Redis實例(實際上這種情況也有辦法,但是不能直接使用交集指令)。同時操作多個key,則不能使用Redis事務.分區使用的粒度是key,不能使用一個非常長的排序key存儲一個數據集(The partitioning granularity is the key, so it is not possible to shard a dataset with a single huge key like a very big sorted set).當使用分區的時候,數據處理會非常複雜,例如為了備份你必須從不同的Redis實例和主機同時收集RDB / AOF文件。分區時動態擴容或縮容可能非常複雜。Redis集群在運行時增加或者刪除Redis節點,能做到最大程度對用戶透明地數據再平衡,但其他一些客戶端分區或者代理分區方法則不支持這種特性。然而,有一種預分片的技術也可以較好的解決這個問題。

36、Redis持久化數據和緩存怎麼做擴容?

如果Redis被當做緩存使用,使用一致性哈希實現動態擴容縮容。如果Redis被當做一個持久化存儲使用,必須使用固定的keys-to-nodes映射關係,節點的數量一旦確定不能變化。否則的話(即Redis節點需要動態變化的情況),必須使用可以在運行時進行數據再平衡的一套系統,而當前只有Redis集群可以做到這樣。

37、分佈式Redis是前期做還是後期規模上來了再做好?為什麼?

既然Redis是如此的輕量(單實例只使用1M內存),為防止以後的擴容,最好的辦法就是一開始就啟動較多實例。即便你只有一臺服務器,你也可以一開始就讓Redis以分佈式的方式運行,使用分區,在同一臺服務器上啟動多個實例。一開始就多設置幾個Redis實例,例如32或者64個實例,對大多數用戶來說這操作起來可能比較麻煩,但是從長久來看做這點犧牲是值得的。這樣的話,當你的數據不斷增長,需要更多的Redis服務器時,你需要做的就是僅僅將Redis實例從一臺服務遷移到另外一臺服務器而已(而不用考慮重新分區的問題)。一旦你添加了另一臺服務器,你需要將你一半的Redis實例從第一臺機器遷移到第二臺機器。

38、Twemproxy是什麼?

Twemproxy是Twitter維護的(緩存)代理系統,代理Memcached的ASCII協議和Redis協議。它是單線程程序,使用c語言編寫,運行起來非常快。它是採用Apache 2.0 license的開源軟件。 Twemproxy支持自動分區,如果其代理的其中一個Redis節點不可用時,會自動將該節點排除(這將改變原來的keys-instances的映射關係,所以你應該僅在把Redis當緩存時使用Twemproxy)。 Twemproxy本身不存在單點問題,因為你可以啟動多個Twemproxy實例,然後讓你的客戶端去連接任意一個Twemproxy實例。 Twemproxy是Redis客戶端和服務器端的一箇中間層,由它來處理分區功能應該不算複雜,並且應該算比較可靠的。

39、支持一致性哈希的客戶端有哪些?

Redis-rb、Predis等。

40、Redis與其他key-value存儲有什麼不同?

Redis有著更為複雜的數據結構並且提供對他們的原子性操作,這是一個不同於其他數據庫的進化路徑。Redis的數據類型都是基於基本數據結構的同時對程序員透明,無需進行額外的抽象。Redis運行在內存中但是可以持久化到磁盤,所以在對不同數據集進行高速讀寫時需要權衡內存,應為數據量不能大於硬件內存。在內存數據庫方面的另一個優點是, 相比在磁盤上相同的複雜的數據結構,在內存中操作起來非常簡單,這樣Redis可以做很多內部複雜性很強的事情。 同時,在磁盤格式方面他們是緊湊的以追加的方式產生的,因為他們並不需要進行隨機訪問。

41、Redis的內存佔用情況怎麼樣?

給你舉個例子: 100萬個鍵值對(鍵是0到999999值是字符串“hello world”)在我的32位的Mac筆記本上 用了100MB。同樣的數據放到一個key裡只需要16MB, 這是因為鍵值有一個很大的開銷。 在Memcached上執行也是類似的結果,但是相對Redis的開銷要小一點點,因為Redis會記錄類型信息引用計數等等。當然,大鍵值對時兩者的比例要好很多。64位的系統比32位的需要更多的內存開銷,尤其是鍵值對都較小時,這是因為64位的系統裡指針佔用了8個字節。 但是,當然,64位系統支持更大的內存,所以為了運行大型的Redis服務器或多或少的需要使用64位的系統。

42、都有哪些辦法可以降低Redis的內存使用情況呢?

如果你使用的是32位的Redis實例,可以好好利用Hash,list,sorted set,set等集合類型數據,因為通常情況下很多小的Key-Value可以用更緊湊的方式存放到一起。

##43、查看Redis使用情況及狀態信息用什麼命令?info44、Redis的內存用完了會發生什麼? 如果達到設置的上限,Redis的寫命令會返回錯誤信息(但是讀命令還可以正常返回。)或者你可以將Redis當緩存來使用配置淘汰機制,當Redis達到內存上限時會沖刷掉舊的內容。## 45、Redis是單線程的,如何提高多核CPU的利用率? 可以在同一個服務器部署多個Redis的實例,並把他們當作不同的服務器來使用,在某些時候,無論如何一個服務器是不夠的, 所以,如果你想使用多個CPU,你可以考慮一下分片(shard)。

46、一個Redis實例最多能存放多少的keys?

List、Set、Sorted Set他們最多能存放多少元素?理論上Redis可以處理多達232的keys,並且在實際中進行了測試,每個實例至少存放了2億5千萬的keys。我們正在測試一些較大的值。任何list、set、和sorted set都可以放232個元素。換句話說,Redis的存儲極限是系統中的可用內存值。

47、Redis常見性能問題和解決方案?

(1) Master最好不要做任何持久化工作,如RDB內存快照和AOF日誌文件 (2) 如果數據比較重要,某個Slave開啟AOF備份數據,策略設置為每秒同步一次 (3) 為了主從複製的速度和連接的穩定性,Master和Slave最好在同一個局域網內 (4) 儘量避免在壓力很大的主庫上增加從庫 (5) 主從複製不要用圖狀結構,用單向鏈表結構更為穩定,即:Master

48、Redis提供了哪幾種持久化方式?

RDB持久化方式能夠在指定的時間間隔能對你的數據進行快照存儲.AOF持久化方式記錄每次對服務器寫的操作,當服務器重啟的時候會重新執行這些命令來恢復原始的數據,AOF命令以redis協議追加保存每次寫的操作到文件末尾.Redis還能對AOF文件進行後臺重寫,使得AOF文件的體積不至於過大.如果你只希望你的數據在服務器運行的時候存在,你也可以不使用任何持久化方式.你也可以同時開啟兩種持久化方式, 在這種情況下, 當redis重啟的時候會優先載入AOF文件來恢復原始的數據,因為在通常情況下AOF文件保存的數據集要比RDB文件保存的數據集要完整.最重要的事情是瞭解RDB和AOF持久化方式的不同,讓我們以RDB持久化方式開始。

49、如何選擇合適的持久化方式?

一般來說, 如果想達到足以媲美PostgreSQL的數據安全性, 你應該同時使用兩種持久化功能。如果你非常關心你的數據, 但仍然可以承受數分鐘以內的數據丟失,那麼你可以只使用RDB持久化。有很多用戶都只使用AOF持久化,但並不推薦這種方式:因為定時生成RDB快照(snapshot)非常便於進行數據庫備份, 並且 RDB 恢復數據集的速度也要比AOF恢復的速度要快,除此之外, 使用RDB還可以避免之前提到的AOF程序的bug。

50、修改配置不重啟Redis會實時生效嗎?

針對運行實例,有許多配置選項可以通過 CONFIG SET 命令進行修改,而無需執行任何形式的重啟。 從 Redis 2.2 開始,可以從 AOF 切換到 RDB 的快照持久性或其他方式而不需要重啟 Redis。檢索 ‘CONFIG GET *’ 命令獲取更多信息。但偶爾重新啟動是必須的,如為升級 Redis 程序到新的版本,或者當你需要修改某些目前 CONFIG 命令還不支持的配置參數的時候。

更多面試題以及答案我以文檔的形式保存,面試不懂?趕緊來領取面試資料多刷題吧!

面試資料獲取方式:【面試資料】(關注我後臺私信回覆)

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

Nginx面試專題

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

Nginx參考答案

Netty的面試專題

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

Netty參考答案

Redis面試專題

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

Redis參考答案

Dubbo面試專題

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊

Dubbo參考答案

ZooKeeper面試專題

阿里Redis最全面試全攻略,讀完這個就可以和阿里面試官好好聊聊


分享到:


相關文章: