Redis 概念以及底層數據結構

Redis 概念以及底層數據結構

Redis 簡介

REmote DIctionary Server(Redis) 是一個由SalvatoreSanfilippo寫的key-value存儲系統。

Redis是一個開源的使用ANSI C語言編寫、遵守BSD協議、支持網絡、可基於內存亦可持久化的日誌型、Key-Value數據庫,並提供多種語言的API。

它通常被稱為數據結構服務器,因為值(value)可以是字符串(String), 哈希(Map), 列表(list), 集合(sets) 和有序集合(sorted sets)等類型。

Redis特點

Redis 是完全開源免費的,遵守BSD協議,是一個高性能的key-value數據庫。

Redis 與其他 key - value 緩存產品有以下三個特點:

  • Redis支持數據的持久化,可以將內存中的數據保持在磁盤中,重啟的時候可以再次加載進行使用。
  • Redis不僅僅支持簡單的key-value類型的數據,同時還提供list,set,zset,hash等數據結構的存儲。
  • Redis支持數據的備份,即master-slave模式的數據備份。

Redis 優勢

性能極高 – Redis能讀的速度是110000次/s,寫的速度是81000次/s 。

豐富的數據類型 – Redis支持 Strings, Lists, Hashes, Sets 及 Ordered Sets 數據類型操作。

原子 – Redis的所有操作都是原子性的,同時Redis還支持對幾個操作全並後的原子性執行。

豐富的特性 – Redis 還支持 publish/subscribe, 隊列,key 過期等等特性。

Redis對象類型簡介

  • Redis是一種key/value型數據庫,其中,每個key和value都是使用對象表示的。 比如,我們執行以下代碼:
redis> SET message "hello redis" 

其中的key是message,是一個包含了字符串"message"的對象。而value是一個包含了"hello redis"的對象。 Redis共有五種對象的類型,分別是:

類型常量對象的名稱REDIS_STRING字符串對象REDIS_LIST列表對象REDIS_HASH哈希對象REDIS_SET集合對象REDIS_ZSET有序集合對象

Redis中的一個對象的結構體表示如下:

typedef struct redisObject { 

// 類型
unsigned type:4;
// 編碼方式
unsigned encoding: 4;

// 引用計數
int refcount;

// 指向對象的值
void *ptr;

} robj;

type表示了該對象的對象類型,即上面五個中的一個。但為了提高存儲效率與程序執行效率,每種對象的底層數據結構實現都可能不止一種。encoding就表示了對象底層所使用的編碼。

  • Redis對象底層數據結構

編碼常量編碼所對應的底層數據結構REDIS_ENCODING_INTlong 類型的整數REDIS_ENCODING_EMBSTRembstr 編碼的簡單動態字符串REDIS_ENCODING_RAW簡單動態字符串REDIS_ENCODING_HT字典REDIS_ENCODING_LINKEDLIST雙端鏈表REDIS_ENCODING_ZIPLIST壓縮列表REDIS_ENCODING_INTSET整數集合REDIS_ENCODING_SKIPLIST跳躍表和字典

  • 字符串對象

字符串對象的編碼可以是int、raw或者embstr 如果一個字符串的內容可以轉換為long,那麼該字符串就會被轉換成為long類型,對象的ptr就會指向該long,並且對象類型也用int類型表示。 普通的字符串有兩種,embstr和raw。embstr應該是Redis 3.0新增的數據結構,在2.8中是沒有的。如果字符串對象的長度小於39字節,就用embstr對象。否則用傳統的raw對象。

#define REDIS_ENCODING_EMBSTR_SIZE_LIMIT 44 
robj *createStringObject(char *ptr, size_t len) {
if (len <= REDIS_ENCODING_EMBSTR_SIZE_LIMIT)
return createEmbeddedStringObject(ptr,len);
else
return createRawStringObject(ptr,len);
}

embstr的好處有如下幾點:

  1. embstr的創建只需分配一次內存,而raw為兩次(一次為sds分配對象,另一次為objet分配對象,embstr省去了第一次)。
  2. 相對地,釋放內存的次數也由兩次變為一次。
  3. embstr的objet和sds放在一起,更好地利用緩存帶來的優勢。

raw和embstr的區別可以用下面兩幅圖所示:

Redis 概念以及底層數據結構

Redis 概念以及底層數據結構

  • 列表對象 列表對象的編碼可以是ziplist或者linkedlist
  1. ziplist是一種壓縮鏈表,它的好處是更能節省內存空間,因為它所存儲的內容都是在連續的內存區域當中的。當列表對象元素不大,每個元素也不大的時候,就採用ziplist存儲但當數據量過大時就ziplist就不是那麼好用了。因為為了保證他存儲內容在內存中的連續性,插入的複雜度是O(N),即每次插入都會重新進行realloc。如下圖所示,對象結構中ptr所指向的就是一個ziplist整個ziplist只需要malloc一次,它們在內存中是一塊連續的區域。
Redis 概念以及底層數據結構

  1. linkedlist是一種雙向鏈表。它的結構比較簡單,節點中存放pre和next兩個指針,還有節點相關的信息。當每增加一個node的時候,就需要重新malloc一塊內存。
Redis 概念以及底層數據結構

  • 哈希對象 哈希對象的底層實現可以是ziplist或者hashtable。 ziplist中的哈希對象是按照key1,value1,key2,value2這樣的順序存放來存儲的。當對象數目不多且內容不大時,這種方式效率是很高的。

hashtable的是由dict這個結構來實現的, dict是一個字典,其中的指針dicht ht[2] 指向了兩個哈希表

typedef struct dict { 
dictType *type;
void *privdata;
dictht ht[2];
long rehashidx; /* rehashing not in progress if rehashidx == -1 */
int iterators; /* number of iterators currently running */
} dict;
typedef struct dictht {
dictEntry **table;
unsigned long size;
unsigned long sizemask;
unsigned long used;
} dictht;

dicht[0] 是用於真正存放數據,dicht[1]一般在哈希表元素過多進行rehash的時候用於中轉數據。 dictht中的table用語真正存放元素了,每個key/value對用一個dictEntry表示,放在dictEntry數組中。

Redis 概念以及底層數據結構

  • 集合對象 集合對象的編碼可以是intset或者hashtable intset是一個整數集合,裡面存的為某種同一類型的整數,支持如下三種長度的整數:
#define INTSET_ENC_INT16 (sizeof(int16_t)) 
#define INTSET_ENC_INT32 (sizeof(int32_t))
#define INTSET_ENC_INT64 (sizeof(int64_t))

intset是一個有序集合,查找元素的複雜度為O(logN),但插入時不一定為O(logN),因為有可能涉及到升級操作。比如當集合裡全是int16_t型的整數,這時要插入一個int32_t,那麼為了維持集合中數據類型的一致,那麼所有的數據都會被轉換成int32_t類型,涉及到內存的重新分配,這時插入的複雜度就為O(N)了。 intset不支持降級操作。

  • 有序集合對象 有序集合的編碼可能兩種,一種是ziplist,另一種是skiplist與dict的結合。 ziplist作為集合和作為哈希對象是一樣的,member和score順序存放。按照score從小到大順序排列 skiplist是一種跳躍表,它實現了有序集合中的快速查找,在大多數情況下它的速度都可以和平衡樹差不多。但它的實現比較簡單,可以作為平衡樹的替代品。它的結構比較特殊。下面分別是跳躍表skiplist和它內部的節點skiplistNode的結構體:
/* 
* 跳躍表
*/
typedef struct zskiplist {
// 頭節點,尾節點
struct zskiplistNode *header, *tail;
// 節點數量
unsigned long length;
// 目前表內節點的最大層數
int level;
} zskiplist;
/* ZSETs use a specialized version of Skiplists */
/*
* 跳躍表節點
*/
typedef struct zskiplistNode {
// member 對象
robj *obj;
// 分值
double score;
// 後退指針
struct zskiplistNode *backward;
// 層
struct zskiplistLevel {
// 前進指針
struct zskiplistNode *forward;
// 這個層跨越的節點數量
unsigned int span;
} level[];
} zskiplistNode;

head和tail分別指向頭節點和尾節點,然後每個skiplistNode裡面的結構又是分層的(即level數組) 用圖表示,大概是下面這個樣子:

Redis 概念以及底層數據結構

總結

以上簡單介紹了Redis的簡介,特性以及五種對象類型和五種對象類型的底層實現。事實上,Redis的高效性和靈活性正是得益於同一個對象類型採用不同的底層結構,並且在必要的時候對二者進行轉換,還有就是各種底層結構對內存的合理利用。

感謝你耐心看完了文章...

關注作者,我會不定期在微頭條分享Java,Spring,MyBatis,Netty源碼分析,高併發、高性能、分佈式、微服務架構的原理,JVM性能優化、分佈式架構,BATJ面試 等資料...


分享到:


相關文章: