redis 常见数据结构实现

2019-09-22 11:16:41 花花世界時間

1、简单动态字符串（SDS）

定义

struct sdshdr {
 // 记录 buf 数组中已使用字节的数量
 int len;
 // 记录 buf 数组中未使用字节的数量
 int free;
 // 字节数组，用于保存字符串
 char buf[];
};

说明：键、值、SDS 还被用作缓冲区（buffer）： AOF 模块中的 AOF 缓冲区，以及客户端状态中的输入缓冲区

字符串和 SDS 之间的区别

C 字符串SDS获取字符串长度的复杂度为 O(N) 。获取字符串长度的复杂度为 O(1) 。API 是不安全的，可能会造成缓冲区溢出。API 是安全的，不会造成缓冲区溢出。修改字符串长度 N 次必然需要执行 N 次内存重分配。修改字符串长度 N 次最多需要执行 N 次内存重分配。只能保存文本数据。可以保存文本或者二进制数据。可以使用所有 <string.h> 库中的函数。/<string.h>可以使用一部分 <string.h> 库中的函数。空间预分配用于优化 SDS 的字符串增长操作：当 SDS 的 API 对一个 SDS 进行修改，并且需要对 SDS 进行空间扩展的时候，程序不仅会为 SDS 分配修改所必须要的空间，还会为 SDS 分配额外的未使用空间。其中，额外分配的未使用空间数量由以下公式决定：如果对 SDS 进行修改之后， SDS 的长度（也即是 len 属性的值）将小于 1 MB ，那么程序分配和 len 属性同样大小的未使用空间，这时 SDS len 属性的值将和 free 属性的值相同。举个例子，如果进行修改之后， SDS 的 len 将变成 13 字节，那么程序也会分配 13 字节的未使用空间， SDS 的 buf 数组的实际长度将变成 13 + 13 + 1 = 27 字节（额外的一字节用于保存空字符）。如果对 SDS 进行修改之后， SDS 的长度将大于等于 1 MB ，那么程序会分配 1 MB 的未使用空间。举个例子，如果进行修改之后， SDS 的 len 将变成 30 MB ，那么程序会分配 1 MB 的未使用空间， SDS 的 buf 数组的实际长度将为 30 MB + 1 MB + 1 byte。通过空间预分配策略， Redis 可以减少连续执行字符串增长操作所需的内存重分配次数。 /<string.h>

2、链表

typedef struct listNode {
 // 前置节点
 struct listNode *prev;
 // 后置节点
 struct listNode *next;
 // 节点的值
 void *value;
} listNode;
typedef struct list {
 // 表头节点
 listNode *head;
 // 表尾节点
 listNode *tail;
 // 链表所包含的节点数量
 unsigned long len;
 // 节点值复制函数
 void *(*dup)(void *ptr);
 // 节点值释放函数
 void (*free)(void *ptr);
 // 节点值对比函数
 int (*match)(void *ptr, void *key);
} list;

特性

双端： 链表节点带有 prev 和 next 指针，获取某个节点的前置节点和后置节点的复杂度都是 O(1) 。 无环： 表头节点的 prev 指针和表尾节点的 next 指针都指向 NULL ，对链表的访问以 NULL 为终点。 带表头指针和表尾指针：通过 list 结构的 head 指针和 tail 指针，程序获取链表的表头节点和表尾节点的复杂度为 O(1) 。 带链表长度计数器：程序使用 list 结构的 len 属性来对 list 持有的链表节点进行计数，程序获取链表中节点数量的复杂度为 O(1) 。多态：链表节点使用 void* 指针来保存，并且可以通过 list 结构的 dup 、 free 、 match 三个属性为节点值设置类型特定函数，所以链表可以用于保存各种不同类型的值。

3、字典

typedef struct dictht {
 // 哈希表数组
 dictEntry **table;
 // 哈希表大小
 unsigned long size;
 // 哈希表大小掩码，用于计算索引值 

 // 总是等于 size - 1
 unsigned long sizemask;
 // 该哈希表已有节点的数量
 unsigned long used;
} dictht;
typedef struct dictEntry {
 // 键
 void *key;
 // 值
 union {
 void *val;
 uint64_t u64;
 int64_t s64;
 } v;
 // 指向下个哈希表节点，形成链表
 struct dictEntry *next;
} dictEntry;
typedef struct dict {
 // 类型特定函数
 dictType *type;
 // 私有数据
 void *privdata;
 // 哈希表
 dictht ht[2];
 // rehash 索引
 // 当 rehash 不在进行时，值为 -1
 int rehashidx; /* rehashing not in progress if rehashidx == -1 */
} dict;

渐进式rehash

1.为 ht[1] 分配空间，让字典同时持有 ht[0] 和 ht[1] 两个哈希表。 2.在字典中维持一个索引计数器变量 rehashidx ，并将它的值设置为 0 ，表示 rehash 工作正式开始。 3.在 rehash 进行期间，每次对字典执行添加、删除、查找或者更新操作时，程序除了执行指定的操作以外，还会顺带将 ht[0] 哈希表在 rehashidx 索引上的所有键值对 rehash 到 ht[1] ，当 rehash 工作完成之后，程序将 rehashidx 属性的值增一。 4.随着字典操作的不断执行，最终在某个时间点上， ht[0] 的所有键值对都会被 rehash 至 ht[1] ，这时程序将 rehashidx 属性的值设为 -1 ，表示 rehash 操作已完成。

4、跳跃表

typedef struct zskiplist {
 // 头节点，尾节点
 struct zskiplistNode *header, *tail;
 // 节点数量
 unsigned long length;
 // 目前表内节点的最大层数
 int level;
} zskiplist;
typedef struct zskiplistNode {
 // 成员对象
 robj *obj;
 // 分值
 double score;
 // 后退指针
 struct zskiplistNode *backward;
 // 层
 struct zskiplistLevel {
 // 前进指针 

 struct zskiplistNode *forward;
 // 跨度
 unsigned int span;
 } level[];
} zskiplistNode;

5、整数集合

typedef struct intset {
 // 编码方式
 uint32_t encoding;
 // 集合包含的元素数量 
 uint32_t length;
 // 保存元素的数组
 int8_t contents[]; 

} intset;

说明

contents 数组是整数集合的底层实现：整数集合的每个元素都是 contents 数组的一个数组项（item），各个项在数组中按值的大小从小到大有序地排列，并且数组中不包含任何重复项。 length 属性记录了整数集合包含的元素数量，也即是 contents 数组的长度。虽然 intset 结构将 contents 属性声明为 int8_t 类型的数组，但实际上 contents 数组并不保存任何 int8_t 类型的值 —— contents 数组的真正类型取决于 encoding 属性的值：如果 encoding 属性的值为 INTSET_ENC_INT16 ，那么 contents 就是一个 int16_t 类型的数组，数组里的每个项都是一个 int16_t类型的整数值（最小值为 -32,768 ，最大值为 32,767 ）。如果 encoding 属性的值为 INTSET_ENC_INT32 ，那么 contents 就是一个 int32_t 类型的数组，数组里的每个项都是一个 int32_t类型的整数值（最小值为 -2,147,483,648 ，最大值为 2,147,483,647 ）。如果 encoding 属性的值为 INTSET_ENC_INT64 ，那么 contents 就是一个 int64_t 类型的数组，数组里的每个项都是一个 int64_t类型的整数值（最小值为 -9,223,372,036,854,775,808 ，最大值为 9,223,372,036,854,775,807 ）

6、压缩链表

属性类型长度用途zlbytesuint32_t4 字节记录整个压缩列表占用的内存字节数：在对压缩列表进行内存重分配，或者计算 zlend的位置时使用。zltailuint32_t4 字节记录压缩列表表尾节点距离压缩列表的起始地址有多少字节：通过这个偏移量，程序无须遍历整个压缩列表就可以确定表尾节点的地址。zllenuint16_t2 字节记录了压缩列表包含的节点数量：当这个属性的值小于 UINT16_MAX （65535）时，这个属性的值就是压缩列表包含节点的数量；当这个值等于 UINT16_MAX 时，节点的真实数量需要遍历整个压缩列表才能计算得出。entryX列表节点不定压缩列表包含的各个节点，节点的长度由节点保存的内容决定。zlenduint8_t1 字节特殊值 0xFF （十进制 255 ），用于标记压缩列表的末端。

定义

节点的 previous_entry_length属性以字节为单位，记录了压缩列表中前一个节点的长度。
节点的 encoding属性记录了节点的 content属性所保存数据的类型以及长度：
节点的 content属性负责保存节点的值，节点值可以是一个字节数组或者整数，值的类型和长度由节点的 encoding属性决定。

7、对象

typedef struct redisObject {
 // 类型
 unsigned type:4;
 // 不使用(对齐位)
 unsigned notused:2;
 // 编码方式
 unsigned encoding:4;
 // LRU 时间（相对于 server.lruclock）
 unsigned lru:22;
 // 引用计数
 int refcount;
 // 指向对象的值
 void *ptr;
} robj;

类型

对象对象 type 属性的值TYPE 命令的输出字符串对象REDIS_STRING"string"列表对象REDIS_LIST"list"哈希对象REDIS_HASH"hash"集合对象REDIS_SET"set"有序集合对象REDIS_ZSET"zset"

编码

类型编码对象OBJECT ENCODING 命令输出REDIS_STRINGREDIS_ENCODING_INT使用整数值实现的字符串对象。"int"REDIS_STRINGREDIS_ENCODING_EMBSTR使用 embstr 编码的简单动态字符串实现的字符串对象。"embstr"REDIS_STRINGREDIS_ENCODING_RAW使用简单动态字符串实现的字符串对象。"raw"REDIS_LISTREDIS_ENCODING_ZIPLIST使用压缩列表实现的列表对象。"ziplist"REDIS_LISTREDIS_ENCODING_LINKEDLIST使用双端链表实现的列表对象。"linkedlist"REDIS_HASHREDIS_ENCODING_ZIPLIST使用压缩列表实现的哈希对象。"ziplist"REDIS_HASHREDIS_ENCODING_HT使用字典实现的哈希对象。"hashtable"REDIS_SETREDIS_ENCODING_INTSET使用整数集合实现的集合对象。"intset"REDIS_SETREDIS_ENCODING_HT使用字典实现的集合对象。"hashtable"REDIS_ZSETREDIS_ENCODING_ZIPLIST使用压缩列表实现的有序集合对象。"ziplist"REDIS_ZSETREDIS_ENCODING_SKIPLIST使用跳跃表和字典实现的有序集合对象。"skiplist"

字符串对象

值编码可以用long类型保存的整数int长度太大的整数或者浮点数embstr或者raw小于等于39字节的字符串embstr大于39字节的字符串raw

字符串对象-embstr和raw区别

embstr 编码是专门用于保存短字符串的一种优化编码方式，这种编码和 raw 编码一样，都使用 redisObject 结构和 sdshdr 结构来表示字符串对象，但 raw 编码会调用两次内存分配函数来分别创建 redisObject 结构和 sdshdr 结构，而 embstr 编码则通过调用一次内存分配函数来分配一块连续的空间，空间中依次包含 redisObject 和 sdshdr 两个结构。优势 embstr 编码将创建字符串对象所需的内存分配次数从 raw 编码的两次降低为一次。释放 embstr 编码的字符串对象只需要调用一次内存释放函数，而释放 raw 编码的字符串对象需要调用两次内存释放函数。因为 embstr 编码的字符串对象的所有数据都保存在一块连续的内存里面，所以这种编码的字符串对象比起 raw 编码的字符串对象能够更好地利用缓存带来的优势。

列表对象

当列表对象可以同时满足以下两个条件时，列表对象使用 ziplist 编码：列表对象保存的所有字符串元素的长度都小于 64 字节；列表对象保存的元素数量小于 512 个；不能满足这两个条件的列表对象需要使用 linkedlist 编码。

哈希对象

当哈希对象可以同时满足以下两个条件时，哈希对象使用 ziplist 编码：哈希对象保存的所有键值对的键和值的字符串长度都小于 64 字节；哈希对象保存的键值对数量小于 512 个；不能满足这两个条件的哈希对象需要使用 hashtable 编码。

集合对象

当集合对象可以同时满足以下两个条件时，对象使用 intset 编码：集合对象保存的所有元素都是整数值；集合对象保存的元素数量不超过 512 个；不能满足这两个条件的集合对象需要使用 hashtable 编码。

hashtable 编码的集合对象使用字典作为底层实现，字典的每个键都是一个字符串对象，每个字符串对象包含了一个集合元素，而字典的值则全部被设置为 NULL

有序集合对象

当有序集合对象可以同时满足以下两个条件时，对象使用 ziplist 编码：有序集合保存的元素数量小于 128 个；有序集合保存的所有元素成员的长度都小于 64 字节；不能满足以上两个条件的有序集合对象将使用 skiplist 编码。

skiplist 编码的有序集合对象使用 zset 结构作为底层实现，一个 zset 结构同时包含一个字典和一个跳跃表。

typedef struct zset {
 zskiplist *zsl;
 dict *dict;
} zset;

如果我们只使用字典来实现有序集合，那么虽然以 O(1) 复杂度查找成员的分值这一特性会被保留，但是，因为字典以无序的方式来保存集合元素，所以每次在执行范围型操作 —— 比如 ZRANK 、 ZRANGE 等命令时，程序都需要对字典保存的所有元素进行排序，完成这种排序需要至少 O(N \\log N) 时间复杂度，以及额外的 O(N) 内存空间（因为要创建一个数组来保存排序后的元素）。另一方面，如果我们只使用跳跃表来实现有序集合，那么跳跃表执行范围型操作的所有优点都会被保留，但因为没有了字典，所以根据成员查找分值这一操作的复杂度将从 O(1) 上升为 O(\\log N)

分享到:

閱讀更多 花花世界時間 的文章

關鍵字: Redis 数据结构镜音双子

Redis设计与实现: redisObject 数据结构，以及 Redis 的数据类型

数据结构-图（图的基本实现C++）

python 数据结构

零基础入门Python：基本命令、函数、数据结构

详解 HashMap 数据结构

五大集合(数据结构)要点

java 数据结构-队列详解

严蔚敏《数据结构》（C语言版）笔记和习题（含考研真题）详解

木兰编程语言入门教程之五——数据结构

【数据结构】秒懂系列:数据结构-堆(Heap)

【数据结构】秒懂系列:数据结构-树-(B+树)

数据结构顺序表（c语言）

二叉树的遍历-数据结构

数据结构--图

数据结构——动手实战双向链表

03.05 数据结构——动手实战双向链表

数据结构-二叉树以及遍历代码

03.01 数据结构--选择排序

03.01 数据结构--插入排序

03.01 数据结构--快速排序

03.01 数据结构--冒泡排序

数据结构——30行代码实现栈和模拟递归

01.数据结构

11.25 安卓系统权限检查机制，存储位置，数据结构

「数据结构」字符串排序算法最全总结

Python3 数据结构

「数据结构」Hash表

深入理解Linux内核中EPOLL机制系列(一)数据结构

09.26 数据结构：有了二叉查找树、平衡树为啥还需要红黑树？

数据结构：数组详细介绍，你足够了解数组的特性和使用场景吗？

数据结构-队列

数据结构-队列，你会了吗？

数据结构-栈

数据结构-数组

抽象数据类型、数据结构、算法与Java语言：ADT List

抽象数据类型、数据结构、算法与Java语言：ADT Queue（队列）

02.26 Python3 自学第9天：数据结构

打破认知：程序设计 = 算法 + 数据结构？

01.09 面试必问的ConcurrentHashMap实现原理：数据结构、get与put操作

数据结构：实现一个队列，并完成各个接口的实现

数据结构——并查集

spark2.0机器学习——数据结构

2018最新BAT技术面试78题：数据结构+网络+NoSQL+分布式架构！

计算机二级《数据结构》知识点总结

数据结构-栈结构实现（java）

数据结构-单向链表实现（java）

数据结构-顺序表基础实现（java）

比特币源码解析(7)-数据结构-区块

数据结构——哈希表

03.23 数据结构——哈希表

第二章 IoC容器和Bean配置

bean是一个对象，它是由Spring

运算里不得不说的python模块—math

Help

Devops度量--DevOps 现状快速检查表

今天主要分享一个DevOps

SOP是什么（解读）

SOP不是单个的，是一个体系，虽然我们可以单独地定义每一个SOP，但真正从企业管理来看，SOP不可能只是单个的，必然是一个整体和体系，也是企业不可或缺的。

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

随着终端设备的越来越多，人工干预配置IP地址，不仅工作效率低，而且，还很容易导致IP冲突，影响正常的网络访问。到此已经完成了，DHCP服务的配置了，我们可以在终端验证。

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

这两天分析了一下头条文章网页的源文件，现在将分析的结果分享给大家。首先以一篇文章为例，其网址如下：https://www.toutiao.com/i6822245428176617998/如上图网页所示，文章中包含文字和图片。

DNS侦查工具

我们只需要打开浏览器输入例如:www.baidu.com就可以解析到该网站.为了便于记住不需要输入长长的IP地址去访问这就是DNS域名解析.关于域名域名的层次划分用点来分割这时DNS把相对应的域名解析成IP地址高的在右边.例如:www. NS简介访问某网站的时候最低在左边

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

Create

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

最后一个要介绍的命令是

（必收藏系列）Linux面试题——命令集

关注，后台私信【Linux】分享Linux入门到进阶电子书、Linux入门到精通视频教程（免费）。文件管理命令cat

五分钟学会如何在 IPFS 上部署网站

原文标题:五分钟学会如何在

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

1）实验平台：【正点原子】

小白怎么学Web前端开发如何成为技术达人

Web前端开发工程师已经成为了很多年轻人心中的理想工作，不仅入行门槛低、而且薪资待遇和发展前景都不错，自然吸引了大批人加入行业。

如何开发一个web静态服务器

我们都知道如今的web服务器有很多，比如著名的有apache，有nginx，有tomcat，有resin服务器，有sphere，有iis服务器等等，这些服务器都能提供web服务，并且几乎都能和多种语言进行搭配使用，那么一个web服务器都需要那些功能，开发一个web服务器都需要那些

学Java编程还有前景吗如何才能拿到高薪

需求大、薪资高似乎是Java开发人员的标签，不过学Java编程还有前景吗？它架构在操作系统之上，屏蔽了底层的差异，真正实现了“Writeonce run

Python网络爬虫之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的运行效率太低？几行代码快速提升！

return的就是是你所需要的结果2.3、运行这一步就是最后一步了，只要像下面一样输入上述函数名，赋予参数值，点击运行Run，就能得到你想要的结果arg1=5

python的优点是什么？最新Python400集视频（附教程）

2020，最新Python零基础到精通资料教材，干货分享，新基础Python教材，稳稳找到过万工作，看这里，这里有你想要的所有资源哦，最强笔记，教你怎么入门提升！获取方式：私信小编“

MySQL中OOM故障应如何下手-爱可生

作者：孙祚龙爱可生南区分公司交付服务部成员，实习工程师。负责公司产品问题排查及日常运维工作。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

像专家一样使用 panic

|go

30种不同的编程语言怎么写“Hello, World”

printfn

percona QAN 介绍

一、背景QAN慢查询日志分析工具是PMM

面试官：你可以用纯CSS判断鼠标进入的方向吗？

虽然没什么软用，但是对付面试官应该是够用了。感谢面试官提出的问题，让我实现了这个功能，对CSS

网络工程师职业生涯中，哪两点是最重要的？

网络工程师最重要的技能是扎实的基础和非常开放的思维，微观知识扎实、宏观能力突出。项目经验也会让网络工程师基础更牢靠，网络工程师是要实战的，要避免纸上谈兵，我认为对基础理论的理解，比你清楚配置更重要。

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

有关以太坊2.0

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

yuminstall

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

今天的你捉住IPFS机遇了吗？我们都知道在Filecoin网络中作为一名存储矿工，信誉对于我们是非常重要的——信誉越高，爆块几率越大。那么信誉系统现在怎么样了呢？

Hive分桶表

fieldsterminated

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

编辑Exchange

$【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库$

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

在阿里云控制台，我们能下载的文件是一个压缩包，解压之后，是.idb和.frm文件，你可能要问了，我可以直接把解压好的问题件覆盖到MySQL的data目录下吗？

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度学习这样实现人脸的年龄检测

前期的文章我们分享了人脸的识别以及如何进行人脸数据的训练，本期文章我们结合人脸识别的模型进行人脸年龄的检测人脸年龄的检测步骤1、首先需要进行人脸的检测2、把检测到的人脸数据给年龄检测模型去检测3、把检测结果呈现到图片上人脸年龄检测import

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

图8-1

深入了解ProcessFunction的状态操作(Flink-1.10)

先反思为何会有上述疑惑上述疑惑产生的原因，应该是受到平时使用HashMap的影响，HashMap获取值就是在调用get方法时指定key，设置值也是在put时指定key，所以看到state.value，看懂了这些，其实也是在了解DataStream/DataSetAPI的设计思路：

Redis内存分析工具--rdr安装与使用

分析Redis

资深架构师教你源码讲解zookeeper实现分布式锁以及集群搭建步骤

//getData发现前一个子节点被删除，抛出异常

一行代码提升迁移性能

论文原址：https://arxiv.org/pdf/2003.12237.pdf开源地址：https://github.com/cuishuhao/BNM在发表在CVPR2020

利用相似几何信息，做可泛化3D形状分割模型

更具体的有以下三种典型的分割方案：FullyConvolutional-Like

这么好用的开源计算器SpeedCrunch，没有不尝试一下的道理

介绍SpeedCrunch是一款高精度科学计算器，具有快速，键盘驱动的用户界面。获取方式在GitHub上搜索SpeedCrunch，就可以去到

分布式缓存，真香

他是前易宝支付架构师、阿里云MVP、腾讯云

特征工程的力量

在本文中，我希望教给您一些有关特征工程的知识，以及如何使用它来对非线性决策边界进行建模。为了说明这一点，假设恢复时间与身高和体重具有以下关系：Y=β₀+β₁+β2+β₃+noise从第三项来看，我们可以看到Y与身高和体重没有线性关系。

java架构：天天写面向接口编程，你考虑过性能吗？大神都是这么写

public

SpringBoot如何优雅的使用RocketMQ

源码编译需要Maven3.2x，JDK8在根目录进行打包:Copymvn-Prelease-all

css代码规范工具stylelint

"mixin"