Redis 内存淘汰机制详解

2018-12-29 09:29:44 青峰科技

前言

Redis内存淘汰指的是用户存储的一些键被可以被Redis主动地从实例中删除，从而产生读miss的情况，那么Redis为什么要有这种功能？这就是我们需要探究的设计初衷。Redis最常见的两种应用场景为缓存和持久存储，首先要明确的一个问题是内存淘汰策略更适合于那种场景？是持久存储还是缓存？

内存的淘汰机制的初衷是为了更好地使用内存，用一定的缓存miss来换取内存的使用效率。

在研究Redislru之前，我们先看下操作系统内存页面置换算法

1. 最佳置换算法(OPT)

最佳(Optimal, OPT)置换算法所选择的被淘汰页面将是以后永不使用的，或者是在最长时间内不再被访问的页面,这样可以保证获得最低的缺页率。但由于人们目前无法预知进程在内存下的若千页面中哪个是未来最长时间内不再被访问的，因而该算法无法实现。

2. 先进先出(FIFO)页面置换算法

优先淘汰最早进入内存的页面，亦即在内存中驻留时间最久的页面。该算法实现简单，只需把调入内存的页面根据先后次序链接成队列，设置一个指针总指向最早的页面。但该算法与进程实际运行时的规律不适应，因为在进程中，有的页面经常被访问。

3.最近最久未使用(LRU)置换算法

选择最近最长时间未访问过的页面予以淘汰，它认为过去一段时间内未访问过的页面，在最近的将来可能也不会被访问。该算法为每个页面设置一个访问字段，来记录页面自上次被访问以来所经历的时间，淘汰页面时选择现有页面中值最大的予以淘汰。

再对上面的实例釆用LRU算法进行页面置换，如图3-29所示。进程第一次对页面2访问时，将最近最久未被访问的页面7置换出去。然后访问页面3时，将最近最久未使用的页面1换出。

时钟(CLOCK)置换算法

LRU算法的性能接近于OPT,但是实现起来比较困难，且开销大；FIFO算法实现简单，但性能差。所以操作系统的设计者尝试了很多算法，试图用比较小的开销接近LRU的性能，这类算法都是CLOCK算法的变体。

简单的CLOCK算法是给每一帧关联一个附加位，称为使用位。当某一页首次装入主存时，该帧的使用位设置为1;当该页随后再被访问到时，它的使用位也被置为1。对于页替换算法，用于替换的候选帧集合看做一个循环缓冲区，并且有一个指针与之相关联。当某一页被替换时，该指针被设置成指向缓冲区中的下一帧。当需要替换一页时，操作系统扫描缓冲区，以查找使用位被置为0的一帧。每当遇到一个使用位为1的帧时，操作系统就将该位重新置为0；如果在这个过程开始时，缓冲区中所有帧的使用位均为0，则选择遇到的第一个帧替换；如果所有帧的使用位均为1,则指针在缓冲区中完整地循环一周，把所有使用位都置为0，并且停留在最初的位置上，替换该帧中的页。由于该算法循环地检查各页面的情况，故称为CLOCK算法，又称为最近未用(Not Recently Used, NRU)算法。

传统的淘汰算法：

FIFO：First In First Out，先进先出。判断被存储的时间，离目前最远的数据优先被淘汰。

LRU：Least Recently Used，最近最少使用。判断最近被使用的时间，目前最远的数据优先被淘汰。

LFU：Least Frequently Used，最不经常使用。在一段时间内，数据被使用次数最少的，优先被淘汰。

REDIS淘汰策略

Redis提供了下面几种淘汰策略供用户选择，其中默认的策略为noeviction策略：

· noeviction：当内存使用达到阈值的时候，所有引起申请内存的命令会报错。

· allkeys-lru：在主键空间中，优先移除最近未使用的key。

· volatile-lru：在设置了过期时间的键空间中，优先移除最近未使用的key。

· allkeys-random：在主键空间中，随机移除某个key。

· volatile-random：在设置了过期时间的键空间中，随机移除某个key。

· volatile-ttl：在设置了过期时间的键空间中，具有更早过期时间的key优先移除。

下面看看几种淘汰策略策略的适用场景：

· allkeys-lru：如果我们的应用对缓存的访问符合幂律分布（也就是存在相对热点数据），或者我们不太清楚我们应用的缓存访问分布状况，我们可以选择allkeys-lru策略。

· allkeys-random：如果我们的应用对于缓存key的访问概率相等，则可以使用这个策略。

· volatile-ttl：这种策略使得我们可以向Redis提示哪些key更适合被eviction。

手写最近最久未使用(LRU)置换算法

距离现在最早使用的会被我们替换掉。不够形象的话我们看下面的例子。

插入1234231

位置11112342

位置2null223423

位置3nullnull34231

…

位置1始终是最早进来的元素，是淘汰位置。新进来的元素如果是新元素直接放在位置3，然后将位置1弹出。如果是已有元素则将其放在位置3并删除之前位置上的已有元素，保持其他元素相对位置不变。

这里的例子就是一个size=3的缓存淘汰实现。

利用LinkedHashMap实现的简单LRU

对于Java.util.LinkedHashMap我们的认识仅仅只是停留在该map可以按照插入的顺序保存，那是不够的。 linkedHashMap还可以实现按照访问顺序保存元素。

先看看如何利用它实现LRU的吧

public class UseLinkedHashMapCache extends LinkedHashMap{
 private int cacheSize;
 public UseLinkedHashMapCache(int cacheSize){

//构造函数一定要放在第一行

super(16,0.75f,true); //那个f如果不加就是double类型，然后该构造没有该类型的入参。然后最为关键的就是那个入参 true

this.cacheSize = cacheSize;

}

@Override

protected boolean removeEldestEntry(Map.Entry eldest){ //重写LinkedHashMap原方法

return size()>cacheSize; //临界条件不能有等于，否则会让缓存尺寸小1

}

关键点:

继承了LinkedHashMap并使用

public LinkedHashMap(int initialCapacity,

float loadFactor,

boolean accessOrder) {

super(initialCapacity, loadFactor);

this.accessOrder = accessOrder;

}

构造函数

重写了

 protected boolean removeEldestEntry(Map.Entry eldest) {
 return false;
 }

看看如何使用

public static void main(String[]args){

 UseLinkedHashMapCache<integer> cache = new UseLinkedHashMapCache<integer>(4);
 cache.put(1, "one"); 

 cache.put(2, "two");
 cache.put(3, "three");
 cache.put(4, "four");
 cache.put(2, "two");
 cache.put(3, "three");
 Iterator<map.entry>> it = cache.entrySet().iterator();
 while(it.hasNext()){
 Map.Entry<integer> entry = it.next();
 Integer key = entry.getKey();
 System.out.print("Key:\t"+key);
 String Value = entry.getValue(); //这个无需打印...
 System.out.println();
 }
 }
/<integer>/<map.entry>/<integer>/<integer>

结果是:

Key: 1

Key: 4

Key: 2

Key: 3

与我们表格中的结果一致。

手写LRU（利用数组）

/**

* 用数组写了一个

* 有个疑问，比如当缓存大小为5 这时候1、2、3、4、4 请问最后一个4是应该插入还是不处理呢？

* 我个人觉得如果这里理解为缓存的key ，那么就应该是不插入结果应该还是1、2、3、4、null

* */

public class HandMakeCache {

//添加次数计数器

static int count =0;

//数组元素计数器

 static int size=0;
 //最大长度
 int maxSize;
 //对象数组
 int [] listArray; //为了简略比较
 //顺序表的初始化方法
 public HandMakeCache(int maxSize)
 {
 listArray = new int [maxSize];
 this.maxSize = maxSize;
 }
 public int getSize(){
 return size;
 }
 public void insert(int obj) throws Exception {
 // 插入过程不应该指定下标，对于用户来讲这应该是透明的，只需要暴露插入的顺序
 boolean exist = false; // 每次insert校验一下是否存在
 int location = 0; // 对于已有元素，记录其已存在的位置
 for (int i = 0; i < maxSize; i++) {
 if (obj == listArray[i]) {
 exist = true;
 location = i; // 记录已存在的位置
 }
 } // 遍历看是否已有，每次插入都要遍历，感觉性能很差
 if (size < this.maxSize) { // 当插入次数小于缓存大小的时候随意插入 

 if (exist) {
 if (location == 0) {
 moveArrayElements(listArray,0,size-2);
 } else if (location < size - 1) { // 已存在元素不在最新的位置
 moveArrayElements(listArray,location,size-2);
 }
 listArray[size - 1] = obj; // 由于已存在
 } else {
 listArray[size] = obj;
 size++; // 数组未满时才计数
 }
 } else { // 此时缓存为满，这时候要保留最末端元素先
 if (!exist || obj == listArray[0]) { // 新元素添加进来，和最远元素添加进来效果一样
 moveArrayElements(listArray,0,maxSize-2);
 } else if (obj != listArray[maxSize - 1]) {
 moveArrayElements(listArray,location,maxSize-2);
 } // 如果添加的是上次添加的元素，则不管了。。
 listArray[maxSize - 1] = obj;
 }
 count++; // 计数
 }
 public Object get(int index) throws Exception {
 return listArray[index];
 }
 /**
 * 平移数组的方法，start是要移动至的头位置，end为最后被移动的位置。
 * */
 public void moveArrayElements(int [] arr, int start, int end){
 for(int i=start;i<=end;i++){
 arr[i] = arr[i+1];
 }
 }
 public static void main(String[] args) {
 int cacheSize = 5;
 HandMakeCache list = new HandMakeCache(cacheSize);
 try
 {
 list.insert(1);
 list.insert(2); 

 list.insert(3);
 list.insert(1);
 list.insert(3);
 list.insert(4);
 list.insert(4);
 list.insert(5);
// list.insert(3);
 for(int i=0;i<cachesize> {
 System.out.println(list.get(i));
 }
 System.out.println("成功插入"+count+"次元素.");
 }
 catch(Exception ex)
 {
 ex.printStackTrace();
 }
 }
}
/<cachesize>

非常重要的一点~ 写LRU之前你一定要知道LRU的正确的含义。。

这里分为几种情况吧..

1. 当数组未满的情况下，随便插

2. 数组满了之后，插入介于头和尾的元素，需要记录其之前存在的下标，然后将大于该下标的元素整体前移。

3. 数组满了之后，插入最新的元素等于什么操作也没有。保持原样

3. 数组满了之后，插入一个不存在的元素等同于插入数组最开始的元素。

比如 1、2、3、4 之后插入5 和 1、2、3、4 之后插入1 结果分别为 2、3、4、5和 2、3、4、1。

缺点:

如果利用数组来存储的话，当我们缓存的大小非常大的时候。比如10W，那么假设我们需要淘汰最远的元素，就需要将99999个元素整体往前移一位，这样还仅仅只是替换一次。大量这样的操作是非常低效的，所以我们还是考虑用链表来实现↓。

分享到:

閱讀更多 青峰科技 的文章

關鍵字: 详解内存 NoSQL

Redis 创始人宣布 Redis 6.0.0 稳定版正式 GA

【开源推荐】Redis 桌面管理工具RedisDesktopManager2020.0 发布

高频Redis面试题解析：Redis 事务是否具备原子性？

Redis 的多线程版本比 Redis 本身要快 5 倍

Redis zset内部实现

Redis 压力测试

Redis 高可用

Redis 缓存

介绍SpringBoot 整合 Redis 缓存

Redis Set和ZSet常用命令

Redis 的数据淘汰策略

Redis 的持久化底层如何实现的和优点缺点

Redis Hash和List常用命令

惊呆了，竟然可以用这种方式秒建 Redis 集群？

redis 安装及队列应用测试

关于缓存穿透、缓存击穿、缓存雪崩的模拟与解决(Redis)

Redis 官网昨日宕机，错误提示为无法连接 Redis

Redis 位图基础到统计活跃用户

redis 常用7种数据类型的使用场景解析

Redis Cluster 3.0集群部署与使用

Redis 讲解系列之与Spring集成

Redis 如何处理已过期的元素？

01.21 「Redis 干货」如何将 Redis 的内存优化？

「Redis」Redis 基础

12.24 面试必问：Redis 是如何进行主从复制的？

Redis 复制搭建

Redis 的 Sentinel

12.03 redis 安装启动

12.02 Redis-AOF持久化

Redis 面试热点：什么是 Redis 的雪崩、穿透和击穿？（附笔记）

Redis 持久化

Redis 消息队列的实现和区别

Redis 一站式管理平台

redis 延时队列

基于 Electron 的 Redis 图形化客户端 k-Redis 数

基于 Electron 的 Redis 图形化客户端 k-Redis

Redis 分布式锁的正确实现方式（Java版）

redis 常见数据结构实现

redis 中如何切换db

Redis 集群分布式锁与 API 网关分布式限流

Redis 5 有序集合新增命令

Redis 杀死许可证：RediSearch、Redis Graph 等五个项目闭源

Redis Sentinel机制与用法说明

Redis 基本数据类型

05.08 高级的 Redis Java客户端-Lettuce

12.19 Redis 队列

Redis 队列

第二章 IoC容器和Bean配置

bean是一个对象，它是由Spring

运算里不得不说的python模块—math

Help

Devops度量--DevOps 现状快速检查表

今天主要分享一个DevOps

SOP是什么（解读）

SOP不是单个的，是一个体系，虽然我们可以单独地定义每一个SOP，但真正从企业管理来看，SOP不可能只是单个的，必然是一个整体和体系，也是企业不可或缺的。

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

随着终端设备的越来越多，人工干预配置IP地址，不仅工作效率低，而且，还很容易导致IP冲突，影响正常的网络访问。到此已经完成了，DHCP服务的配置了，我们可以在终端验证。

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

这两天分析了一下头条文章网页的源文件，现在将分析的结果分享给大家。首先以一篇文章为例，其网址如下：https://www.toutiao.com/i6822245428176617998/如上图网页所示，文章中包含文字和图片。

DNS侦查工具

我们只需要打开浏览器输入例如:www.baidu.com就可以解析到该网站.为了便于记住不需要输入长长的IP地址去访问这就是DNS域名解析.关于域名域名的层次划分用点来分割这时DNS把相对应的域名解析成IP地址高的在右边.例如:www. NS简介访问某网站的时候最低在左边

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

Create

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

最后一个要介绍的命令是

（必收藏系列）Linux面试题——命令集

关注，后台私信【Linux】分享Linux入门到进阶电子书、Linux入门到精通视频教程（免费）。文件管理命令cat

五分钟学会如何在 IPFS 上部署网站

原文标题:五分钟学会如何在

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

1）实验平台：【正点原子】

小白怎么学Web前端开发如何成为技术达人

Web前端开发工程师已经成为了很多年轻人心中的理想工作，不仅入行门槛低、而且薪资待遇和发展前景都不错，自然吸引了大批人加入行业。

如何开发一个web静态服务器

我们都知道如今的web服务器有很多，比如著名的有apache，有nginx，有tomcat，有resin服务器，有sphere，有iis服务器等等，这些服务器都能提供web服务，并且几乎都能和多种语言进行搭配使用，那么一个web服务器都需要那些功能，开发一个web服务器都需要那些

学Java编程还有前景吗如何才能拿到高薪

需求大、薪资高似乎是Java开发人员的标签，不过学Java编程还有前景吗？它架构在操作系统之上，屏蔽了底层的差异，真正实现了“Writeonce run

Python网络爬虫之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的运行效率太低？几行代码快速提升！

return的就是是你所需要的结果2.3、运行这一步就是最后一步了，只要像下面一样输入上述函数名，赋予参数值，点击运行Run，就能得到你想要的结果arg1=5

python的优点是什么？最新Python400集视频（附教程）

2020，最新Python零基础到精通资料教材，干货分享，新基础Python教材，稳稳找到过万工作，看这里，这里有你想要的所有资源哦，最强笔记，教你怎么入门提升！获取方式：私信小编“

MySQL中OOM故障应如何下手-爱可生

作者：孙祚龙爱可生南区分公司交付服务部成员，实习工程师。负责公司产品问题排查及日常运维工作。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

像专家一样使用 panic

|go

30种不同的编程语言怎么写“Hello, World”

printfn

percona QAN 介绍

一、背景QAN慢查询日志分析工具是PMM

面试官：你可以用纯CSS判断鼠标进入的方向吗？

虽然没什么软用，但是对付面试官应该是够用了。感谢面试官提出的问题，让我实现了这个功能，对CSS

网络工程师职业生涯中，哪两点是最重要的？

网络工程师最重要的技能是扎实的基础和非常开放的思维，微观知识扎实、宏观能力突出。项目经验也会让网络工程师基础更牢靠，网络工程师是要实战的，要避免纸上谈兵，我认为对基础理论的理解，比你清楚配置更重要。

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

有关以太坊2.0

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

yuminstall

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

今天的你捉住IPFS机遇了吗？我们都知道在Filecoin网络中作为一名存储矿工，信誉对于我们是非常重要的——信誉越高，爆块几率越大。那么信誉系统现在怎么样了呢？

Hive分桶表

fieldsterminated

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

编辑Exchange

$【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库$

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

在阿里云控制台，我们能下载的文件是一个压缩包，解压之后，是.idb和.frm文件，你可能要问了，我可以直接把解压好的问题件覆盖到MySQL的data目录下吗？

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度学习这样实现人脸的年龄检测

前期的文章我们分享了人脸的识别以及如何进行人脸数据的训练，本期文章我们结合人脸识别的模型进行人脸年龄的检测人脸年龄的检测步骤1、首先需要进行人脸的检测2、把检测到的人脸数据给年龄检测模型去检测3、把检测结果呈现到图片上人脸年龄检测import

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

图8-1

深入了解ProcessFunction的状态操作(Flink-1.10)

先反思为何会有上述疑惑上述疑惑产生的原因，应该是受到平时使用HashMap的影响，HashMap获取值就是在调用get方法时指定key，设置值也是在put时指定key，所以看到state.value，看懂了这些，其实也是在了解DataStream/DataSetAPI的设计思路：

Redis内存分析工具--rdr安装与使用

分析Redis

资深架构师教你源码讲解zookeeper实现分布式锁以及集群搭建步骤

//getData发现前一个子节点被删除，抛出异常

一行代码提升迁移性能

论文原址：https://arxiv.org/pdf/2003.12237.pdf开源地址：https://github.com/cuishuhao/BNM在发表在CVPR2020

利用相似几何信息，做可泛化3D形状分割模型

更具体的有以下三种典型的分割方案：FullyConvolutional-Like

这么好用的开源计算器SpeedCrunch，没有不尝试一下的道理

介绍SpeedCrunch是一款高精度科学计算器，具有快速，键盘驱动的用户界面。获取方式在GitHub上搜索SpeedCrunch，就可以去到

分布式缓存，真香

他是前易宝支付架构师、阿里云MVP、腾讯云

特征工程的力量

在本文中，我希望教给您一些有关特征工程的知识，以及如何使用它来对非线性决策边界进行建模。为了说明这一点，假设恢复时间与身高和体重具有以下关系：Y=β₀+β₁+β2+β₃+noise从第三项来看，我们可以看到Y与身高和体重没有线性关系。

java架构：天天写面向接口编程，你考虑过性能吗？大神都是这么写

public

SpringBoot如何优雅的使用RocketMQ

源码编译需要Maven3.2x，JDK8在根目录进行打包:Copymvn-Prelease-all

css代码规范工具stylelint

"mixin"