{吊打面試官系列}——Redis

Redis在互聯網技術存儲方面使用如此廣泛,幾乎所有的後端技術面試官都要在Redis的使用和原理方面對小夥伴們進行各種刁難。作為一名在互聯網技術行業打擊過成百上千名【請允許我誇張一下】的資深技術面試官,看過了無數落寞的身影失望的離開,略感愧疚,故獻上此文,希望各位讀者以後面試勢如破竹,永無失敗!


{吊打面試官系列}——Redis


面試開始

一個大腹便便,穿著格子襯衣的中年男子,拿著一個滿是劃痕的mac向你走來,看著快禿頂的頭髮,心想著肯定是尼瑪頂級架構師吧!但是我們腹有詩書氣自華,虛都不虛。

夥子您好,看你簡歷上寫了你項目裡面用到了Redis,你們為啥用Redis?

心裡忍不住暗罵,這叫啥問題,大家不都是用的這個嘛,但是你不能說出來。

認真回答道:帥氣迷人的面試官您好,因為傳統的關係型數據庫如Mysql已經不能適用所有的場景了,比如秒殺的庫存扣減,APP首頁的訪問流量高峰等等,都很容易把數據庫打崩,所以引入了緩存中間件,目前市面上比較常用的緩存中間件有Redis 和 Memcached 不過中和考慮了他們的優缺點,最後選擇了Redis。

至於更細節的對比朋友們記得查閱Redis 和 Memcached 的區別,比如兩者的優缺點對比和各自的場景,後續我有時間也會寫出來。

那小夥子,我再問你,Redis有哪些數據結構呀?

字符串String、字典Hash、列表List、集合Set、有序集合SortedSet。

這裡我相信99%的讀者都能回答上來Redis的5個基本數據類型。如果回答不出來的小夥伴我們就要加油補課喲,大家知道五種類型最適合的場景更好。

但是,如果你是Redis中高級用戶,而且你要在這次面試中突出你和其他候選人的不同,還需要加上下面幾種數據結構HyperLogLog、Geo、Pub/Sub。

如果你還想加分,那你說還玩過Redis Module,像BloomFilter,RedisSearch,Redis-ML,這個時候面試官得眼睛就開始發亮了,心想這個小夥子有點東西啊

如果有大量的key需要設置同一時間過期,一般需要注意什麼?

如果大量的key過期時間設置的過於集中,到過期的那個時間點,redis可能會出現短暫的卡頓現象。嚴重的話會出現緩存雪崩,我們一般需要在時間上加一個隨機值,使得過期時間分散一些。

電商首頁經常會使用定時任務刷新緩存,可能大量的數據失效時間都十分集中,如果失效時間一樣,又剛好在失效的時間點大量用戶湧入,就有可能造成緩存雪崩

那你使用過Redis分佈式鎖麼,它是什麼回事?

先拿setnx來爭搶鎖,搶到之後,再用expire給鎖加一個過期時間防止鎖忘記了釋放。

這時候對方會告訴你說你回答得不錯,然後接著問如果在setnx之後執行expire之前進程意外crash或者要重啟維護了,那會怎麼樣?

這時候你要給予驚訝的反饋:唉,是喔,這個鎖就永遠得不到釋放了。緊接著你需要抓一抓自己得腦袋,故作思考片刻,好像接下來的結果是你主動思考出來的,然後回答:我記得set指令有非常複雜的參數,這個應該是可以同時把setnx和expire合成一條指令來用的!

對方這時會顯露笑容,心裡開始默唸:嗯,這小子還不錯,開始有點意思了。

假如Redis裡面有1億個key,其中有10w個key是以某個固定的已知的前綴開頭的,如何將它們全部找出來?

使用keys指令可以掃出指定模式的key列表。


{吊打面試官系列}——Redis


對方接著追問:如果這個redis正在給線上的業務提供服務,那使用keys指令會有什麼問題?

這個時候你要回答redis關鍵的一個特性:redis的單線程的。keys指令會導致線程阻塞一段時間,線上服務會停頓,直到指令執行完畢,服務才能恢復。這個時候可以使用scan指令,scan指令可以無阻塞的提取出指定模式的key列表,但是會有一定的重複概率,在客戶端做一次去重就可以了,但是整體所花費的時間會比直接用keys指令長。

不過,增量式迭代命令也不是沒有缺點的: 舉個例子, 使用 SMEMBERS 命令可以返回集合鍵當前包含的所有元素, 但是對於 SCAN 這類增量式迭代命令來說, 因為在對鍵進行增量式迭代的過程中, 鍵可能會被修改, 所以增量式迭代命令只能對被返回的元素提供有限的保證 。

使用過Redis做異步隊列麼,你是怎麼用的?

一般使用list結構作為隊列,rpush生產消息,lpop消費消息。當lpop沒有消息的時候,要適當sleep一會再重試。

如果對方追問可不可以不用sleep呢?

list還有個指令叫blpop,在沒有消息的時候,它會阻塞住直到消息到來。

如果對方接著追問能不能生產一次消費多次呢?

使用pub/sub主題訂閱者模式,可以實現 1:N 的消息隊列。

如果對方繼續追問 pub/su b有什麼缺點?

在消費者下線的情況下,生產的消息會丟失,得使用專業的消息隊列如RocketMQ等。

如果對方究極TM追問Redis如何實現延時隊列?

這一套連招下來,我估計現在你很想把面試官一棒打死(面試官自己都想打死自己了怎麼問了這麼多自己都不知道的),如果你手上有一根棒球棍的話,但是你很剋制。平復一下激動的內心,然後神態自若的回答道:使用sortedset,拿時間戳作為score,消息內容作為key調用zadd來生產消息,消費者用zrangebyscore指令獲取N秒之前的數據輪詢進行處理。

到這裡,面試官暗地裡已經對你豎起了大拇指。並且已經默默給了你A+,但是他不知道的是此刻你卻豎起了中指,在椅子背後。

Redis是怎麼持久化的?服務主從數據怎麼交互的?

RDB做鏡像全量持久化,AOF做增量持久化。因為RDB會耗費較長時間,不夠實時,在停機的時候會導致大量丟失數據,所以需要AOF來配合使用。在redis實例重啟時,會使用RDB持久化文件重新構建內存,再使用AOF重放近期的操作指令來實現完整恢復重啟之前的狀態。

這裡很好理解,把RDB理解為一整個表全量的數據,AOF理解為每次操作的日誌就好了,服務器重啟的時候先把表的數據全部搞進去,但是他可能不完整,你再回放一下日誌,數據不就完整了嘛。不過Redis本身的機制是 AOF持久化開啟且存在AOF文件時,優先加載AOF文件;AOF關閉或者AOF文件不存在時,加載RDB文件;加載AOF/RDB文件城後,Redis啟動成功; AOF/RDB文件存在錯誤時,Redis啟動失敗並打印錯誤信息

對方追問那如果突然機器掉電會怎樣?

取決於AOF日誌sync屬性的配置,如果不要求性能,在每條寫指令時都sync一下磁盤,就不會丟失數據。但是在高性能的要求下每次都sync是不現實的,一般都使用定時sync,比如1s1次,這個時候最多就會丟失1s的數據。

對方追問RDB的原理是什麼?

你給出兩個詞彙就可以了,fork和cow。fork是指redis通過創建子進程來進行RDB操作,cow指的是copy on write,子進程創建後,父子進程共享數據段,父進程繼續提供讀寫服務,寫髒的頁面數據會逐漸和子進程分離開來。

注:回答這個問題的時候,如果你還能說出AOF和RDB的優缺點,我覺得我是面試官在這個問題上我會給你點贊,兩者其實區別還是很大的,而且涉及到Redis集群的數據同步問題等等。想了解的夥伴也可以留言,我會專門寫一篇來介紹的。

Pipeline有什麼好處,為什麼要用pipeline?

可以將多次IO往返的時間縮減為一次,前提是pipeline執行的指令之間沒有因果相關性。使用redis-benchmark進行壓測的時候可以發現影響redis的QPS峰值的一個重要因素是pipeline批次指令的數目。

Redis的同步機制瞭解麼?

Redis可以使用主從同步,從從同步。第一次同步時,主節點做一次bgsave,並同時將後續修改操作記錄到內存buffer,待完成後將RDB文件全量同步到複製節點,複製節點接受完成後將RDB鏡像加載到內存。加載完成後,再通知主節點將期間修改的操作記錄同步到複製節點進行重放就完成了同步過程。後續的增量數據通過AOF日誌同步即可,有點類似數據庫的binlog。

是否使用過Redis集群,集群的高可用怎麼保證,集群的原理是什麼?

Redis Sentinal著眼於高可用,在master宕機時會自動將slave提升為master,繼續提供服務。

Redis Cluster著眼於擴展性,在單個redis內存不足時,使用Cluster進行分片存儲。


{吊打面試官系列}——Redis

面試結束

小夥子你可以的,什麼時候有時間來上班啊,要不明天就來吧?

你強裝鎮定,這麼急啊我還需要租房,要不下禮拜一吧。

好的 心想這小子這麼NB是不是很多Offer在手上,不行我得叫hr給他加錢。

能撐到最後,你自己都忍不住自己給自己點個讚了(暗示點贊,每次都看了不點贊,你們想白嫖我麼?你們好壞喲,不過我喜歡⁄(⁄ ⁄•⁄ω⁄•⁄ ⁄)⁄)。

總結

在技術面試的時候,不管是Redis還是什麼問題,如果你能舉出實際的例子,或者是直接說自己開發過程的問題和收穫會給面試官的印象分會加很多,回答邏輯性也要強一點,不要東一點西一點,容易把自己都繞暈的。


分享到:


相關文章: