Redis两种持久化机制RDB和AOF详解

redis是一个内存数据库,数据保存在内存中,但是我们都知道内存的数据变化是很快的,也容易发生丢失 。幸好Redis还为我们提供了持久化的机制,分别是RDB(Redis DataBase)和AOF(Append Only File) 。

在这里假设你已经了解了redis的基础语法,某字母网站都有很好的教程,可以去看 。基本使用的文章就不写了,都是一些常用的命令 。
下面针对这两种方式来介绍一下 。由浅入深 。
一、持久化流程既然redis的数据可以保存在磁盘上,那么这个流程是什么样的呢?
要有下面五个过程:
(1)客户端向服务端发送写操作(数据在客户端的内存中) 。
(2)数据库服务端接收到写请求的数据(数据在服务端的内存中) 。
(3)服务端调用write这个系统调用,将数据往磁盘上写(数据在系统内存的缓冲区中) 。
(4)操作系统将缓冲区中的数据转移到磁盘控制器上(数据在磁盘缓存中) 。
(5)磁盘控制器将数据写到磁盘的物理介质中(数据真正落到磁盘上) 。
这5个过程是在理想条件下一个正常的保存流程,但是在大多数情况下,我们的机器等等都会有各种各样的故障,这里划分了两种情况:
(1)Redis数据库发生故障,只要在上面的第三步执行完毕,那么就可以持久化保存,剩下的两步由操作系统替我们完成 。
(2)操作系统发生故障,必须上面5步都完成才可以 。
在这里只考虑了保存的过程可能发生的故障,其实保存的数据也有可能发生损坏,需要一定的恢复机制,不过在这里就不再延伸了 。现在主要考虑的是redis如何来实现上面5个保存磁盘的步骤 。它提供了两种策略机制,也就是RDB和AOF 。
二、RDB机制RDB其实就是把数据以快照的形式保存在磁盘上 。什么是快照呢,你可以理解成把当前时刻的数据拍成一张照片保存下来 。
RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘 。也是默认的持久化方式,这种方式是就是将内存中数据以快照的方式写入到二进制文件中,默认的文件名为dump.rdb 。
在我们安装了redis之后,所有的配置都是在redis.conf文件中,里面保存了RDB和AOF两种持久化机制的各种配置 。
既然RDB机制是通过把某个时刻的所有数据生成一个快照来保存,那么就应该有一种触发机制,是实现这个过程 。对于RDB来说,提供了三种机制:save、bgsave、自动化 。我们分别来看一下
1、save触发方式
该命令会阻塞当前Redis服务器,执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止 。具体流程如下:
Redis两种持久化机制RDB和AOF详解

文章插图
 
执行完成时候如果存在老的RDB文件,就把新的替代掉旧的 。我们的客户端可能都是几万或者是几十万,这种方式显然不可取 。
2、bgsave触发方式
执行该命令时,Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求 。具体流程如下:
Redis两种持久化机制RDB和AOF详解

文章插图
 
具体操作是Redis进程执行fork操作创建子进程,RDB持久化过程由子进程负责,完成后自动结束 。阻塞只发生在fork阶段,一般时间很短 。基本上 Redis 内部所有的RDB操作都是采用 bgsave 命令 。
3、自动触发
自动触发是由我们的配置文件来完成的 。在redis.conf配置文件中,里面有如下配置,我们可以去设置:
①save:这里是用来配置触发 Redis的 RDB 持久化条件,也就是什么时候将内存中的数据保存到硬盘 。比如“save m n” 。表示m秒内数据集存在n次修改时,自动触发bgsave 。
默认如下配置:
#表示900秒内如果至少有1个key的值变化,则保存save9001#表示300秒内如果至少有10个key的值变化,则保存save30010#表示60秒内如果至少有10000个key的值变化,则保存save6010000不需要持久化,那么你可以注释掉所有的 save 行来停用保存功能 。
②stop-writes-on-bgsave-error :默认值为yes 。当启用了RDB且最后一次后台保存数据失败,Redis是否停止接收数据 。这会让用户意识到数据没有正确持久化到磁盘上,否则没有人会注意到灾难(disaster)发生了 。如果Redis重启了,那么又可以重新开始接收数据了
③rdbcompression ;默认值是yes 。对于存储到磁盘中的快照,可以设置是否进行压缩存储 。
④rdbchecksum :默认值是yes 。在存储快照后,我们还可以让redis使用CRC64算法来进行数据校验,但是这样做会增加大约10%的性能消耗,如果希望获取到最大的性能提升,可以关闭此功能 。


推荐阅读