如何从数据存储角度分析Redis为何这么快

111次阅读

没有评论

共计 6451 个字符，预计需要花费 17 分钟才能阅读完成。

如何从数据存储角度分析 Redis 为何这么快，很多新手对此不是很清楚，为了帮助大家解决这个难题，下面丸趣 TV 小编将为大家详细讲解，有这方面需求的人可以来学习下，希望你能有所收获。

一、简介和应用

Redis 是一个由 ANSI C 语言编写，性能优秀、支持网络、可持久化的 K - K 内存数据库，并提供多种语言的 API。它常用的类型主要是 String、List、Hash、Set、ZSet 这 5 种

Redis 在互联网公司一般有以下应用:

String：缓存、限流、计数器、分布式锁、分布式 Session

Hash：存储用户信息、用户主页访问量、组合查询

List：微博关注人时间轴列表、简单队列

Set：赞、踩、标签、好友关系

Zset：排行榜

再比如电商在大促销时，会用一些特殊的设计来保证系统稳定，扣减库存可以考虑如下设计：

上图中，直接在 Redis 中扣减库存，记录日志后通过 Worker 同步到数据库，在设计同步 Worker 时需要考虑并发处理和重复处理的问题。

通过上面的应用场景可以看出 Redis 是非常高效和稳定的，那 Redis 底层是如何实现的呢？

二、Redis 的对象 redisObject

当我们执行 set hello world 命令时，会有以下数据模型：

dictEntry：Redis 给每个 key-value 键值对分配一个 dictEntry，里面有着 key 和 val 的指针，next 指向下一个 dictEntry 形成链表，这个指针可以将多个哈希值相同的键值对链接在一起，由此来解决哈希冲突问题(链地址法)。

sds：键 key“hello”是以 SDS（简单动态字符串）存储，后面详细介绍。

redisObject：值 val“world”存储在 redisObject 中。实际上，redis 常用 5 中类型都是以 redisObject 来存储的；而 redisObject 中的 type 字段指明了 Value 对象的类型，ptr 字段则指向对象所在的地址。

redisObject 对象非常重要，Redis 对象的类型、内部编码、内存回收、共享对象等功能，都需要 redisObject 支持。这样设计的好处是，可以针对不同的使用场景，对 5 中常用类型设置多种不同的数据结构实现，从而优化对象在不同场景下的使用效率。

无论是 dictEntry 对象，还是 redisObject、SDS 对象，都需要内存分配器（如 jemalloc）分配内存进行存储。jemalloc 作为 Redis 的默认内存分配器，在减小内存碎片方面做的相对比较好。比如 jemalloc 在 64 位系统中，将内存空间划分为小、大、巨大三个范围；每个范围内又划分了许多小的内存块单位；当 Redis 存储数据时，会选择大小最合适的内存块进行存储。

前面说过，Redis 每个对象由一个 redisObject 结构表示，它的 ptr 指针指向底层实现的数据结构，而数据结构由 encoding 属性决定。比如我们执行以下命令得到存储“hello”对应的编码：

redis 所有的数据结构类型如下（重要，后面会用）：

三、String

字符串对象的底层实现可以是 int、raw、embstr（上面的表对应有名称介绍）。embstr 编码是通过调用一次内存分配函数来分配一块连续的空间，而 raw 需要调用两次。

int 编码字符串对象和 embstr 编码字符串对象在一定条件下会转化为 raw 编码字符串对象。embstr：=39 字节的字符串。int：8 个字节的长整型。raw：大于 39 个字节的字符串。

简单动态字符串（SDS），这种结构更像 C ++ 的 String 或者 Java 的 ArrayList Character，长度动态可变：

struct sdshdr { // buf  中已占用空间的长度  int len; // buf  中剩余可用空间的长度  int free; //  数据空间  char buf[]; //  rsquo; rsquo; 空字符结尾  };

get：sdsrange—O(n)

set：sdscpy mdash;O(n)

create：sdsnew—O(1)

len：sdslen—O(1)

常数复杂度获取字符串长度：因为 SDS 在 len 属性中记录了长度，所以获取一个 SDS 长度时间复杂度仅为 O(1)。

预空间分配：如果对一个 SDS 进行修改，分为一下两种情况：

SDS 长度（len 的值）小于 1MB，那么程序将分配和 len 属性同样大小的未使用空间，这时 free 和 len 属性值相同。举个例子，SDS 的 len 将变成 15 字节，则程序也会分配 15 字节的未使用空间，SDS 的 buf 数组的实际长度变成 15+15+1=31 字节（额外一个字节用户保存空字符）。

SDS 长度（len 的值）大于等于 1MB，程序会分配 1MB 的未使用空间。比如进行修改之后，SDS 的 len 变成 30MB，那么它的实际长度是 30MB+1MB+1byte。

惰性释放空间：当执行 sdstrim（截取字符串）之后，SDS 不会立马释放多出来的空间，如果下次再进行拼接字符串操作，且拼接的没有刚才释放的空间大，则那些未使用的空间就会排上用场。通过惰性释放空间避免了特定情况下操作字符串的内存重新分配操作。

杜绝缓冲区溢出：使用 C 字符串的操作时，如果字符串长度增加（如 strcat 操作）而忘记重新分配内存，很容易造成缓冲区的溢出；而 SDS 由于记录了长度，相应的操作在可能造成缓冲区溢出时会自动重新分配内存，杜绝了缓冲区溢出。

四、List

List 对象的底层实现是 quicklist（快速列表，是 ziplist 压缩列表和 linkedlist 双端链表的组合）。Redis 中的列表支持两端插入和弹出，并可以获得指定位置（或范围）的元素，可以充当数组、队列、栈等。

typedef struct listNode { //  前置节点  struct listNode *prev; //  后置节点  struct listNode *next; //  节点的值  void *value; } listNode; typedef struct list { //  表头节点  listNode *head; //  表尾节点  listNode *tail; //  节点值复制函数  void *(*dup)(void *ptr); //  节点值释放函数  void (*free)(void *ptr); //  节点值对比函数  int (*match)(void *ptr, void *key); //  链表所包含的节点数量  unsigned long len; } list;

rpush: listAddNodeHead —O(1)

lpush: listAddNodeTail —O(1)

push:listInsertNode —O(1)

index : listIndex —O(N)

pop:ListFirst/listLast —O(1)

llen:listLength —O(N)

4.1 linkedlist（双端链表）

此结构比较像 Java 的 LinkedList，有兴趣可以阅读一下源码。

从图中可以看出 Redis 的 linkedlist 双端链表有以下特性：节点带有 prev、next 指针、head 指针和 tail 指针，获取前置节点、后置节点、表头节点和表尾节点的复杂度都是 O（1）。len 属性获取节点数量也为 O（1）。

与双端链表相比，压缩列表可以节省内存空间，但是进行修改或增删操作时，复杂度较高；因此当节点数量较少时，可以使用压缩列表；但是节点数量多时，还是使用双端链表划算。

4.2 ziplist（压缩列表）

当一个列表键只包含少量列表项，且是小整数值或长度比较短的字符串时，那么 redis 就使用 ziplist（压缩列表）来做列表键的底层实现。

ziplist 是 Redis 为了节约内存而开发的，是由一系列特殊编码的连续内存块 (而不是像双端链表一样每个节点是指针) 组成的顺序型数据结构；具体结构相对比较复杂，有兴趣读者可以看 Redis 哈希结构内存模型剖析。在新版本中 list 链表使用 quicklist 代替了 ziplist 和 linkedlist：

quickList 是 zipList 和 linkedList 的混合体。它将 linkedList 按段切分，每一段使用 zipList 来紧凑存储，多个 zipList 之间使用双向指针串接起来。因为链表的附加空间相对太高，prev 和 next 指针就要占去 16 个字节 (64bit 系统的指针是 8 个字节)，另外每个节点的内存都是单独分配，会加剧内存的碎片化，影响内存管理效率。

quicklist 默认的压缩深度是 0，也就是不压缩。为了支持快速的 push/pop 操作，quicklist 的首尾两个 ziplist 不压缩，此时深度就是 1。为了进一步节约空间，Redis 还会对 ziplist 进行压缩存储，使用 LZF 算法压缩。

五、Hash

Hash 对象的底层实现可以是 ziplist（压缩列表）或者 hashtable（字典或者也叫哈希表）。

Hash 对象只有同时满足下面两个条件时，才会使用 ziplist（压缩列表）：1. 哈希中元素数量小于 512 个；2. 哈希中所有键值对的键和值字符串长度都小于 64 字节。

hashtable 哈希表可以实现 O(1)复杂度的读写操作，因此效率很高。源码如下：

typedef struct dict { //  类型特定函数  dictType *type; //  私有数据  void *privdata; //  哈希表  dictht ht[2]; // rehash  索引  //  当  rehash  不在进行时，值为  -1 int rehashidx; /* rehashing not in progress if rehashidx == -1 */ //  目前正在运行的安全迭代器的数量  int iterators; /* number of iterators currently running */ } dict; typedef struct dictht { //  哈希表数组  dictEntry **table; //  哈希表大小  unsigned long size; //  哈希表大小掩码，用于计算索引值  //  总是等于  size - 1 unsigned long sizemask; //  该哈希表已有节点的数量  unsigned long used; } dictht; typedef struct dictEntry { void *key; union {void *val;uint64_t u64;int64_t s64;} v; //  指向下个哈希表节点，形成链表  struct dictEntry *next; } dictEntry; typedef struct dictType { //  计算哈希值的函数  unsigned int (*hashFunction)(const void *key); //  复制键的函数  void *(*keyDup)(void *privdata, const void *key); //  复制值的函数  void *(*valDup)(void *privdata, const void *obj); //  对比键的函数  int (*keyCompare)(void *privdata, const void *key1, const void *key2); //  销毁键的函数  void (*keyDestructor)(void *privdata, void *key); //  销毁值的函数  void (*valDestructor)(void *privdata, void *obj); } dictType;

上面源码可以简化成如下结构：

这个结构类似于 JDK7 以前的 HashMap String,Object，当有两个或以上的键被分配到哈希数组的同一个索引上时，会产生哈希冲突。Redis 也使用链地址法来解决键冲突。即每个哈希表节点都有一个 next 指针，多个哈希表节点用 next 指针构成一个单项链表，链地址法就是将相同 hash 值的对象组织成一个链表放在 hash 值对应的槽位。

Redis 中的字典使用 hashtable 作为底层实现的话，每个字典会带有两个哈希表，一个平时使用，另一个仅在 rehash（重新散列）时使用。随着对哈希表的操作，键会逐渐增多或减少。为了让哈希表的负载因子维持在一个合理范围内，Redis 会对哈希表的大小进行扩展或收缩（rehash），也就是将 ht【0】里面所有的键值对分多次、渐进式的 rehash 到 ht【1】里。

六、Set

Set 集合对象的底层实现可以是 intset（整数集合）或者 hashtable（字典或者也叫哈希表）。

intset（整数集合）当一个集合只含有整数，并且元素不多时会使用 intset（整数集合）作为 Set 集合对象的底层实现。

typedef struct intset { //  编码方式  uint32_t encoding; //  集合包含的元素数量  uint32_t length; //  保存元素的数组  int8_t contents[]; } intset;

sadd:intsetAdd—O(1)

smembers:intsetGetO(1)—O(N)

srem:intsetRemove—O(N)

slen:intsetlen —O(1)

intset 底层实现为有序，无重复数组保存集合元素。intset 这个结构里的整数数组的类型可以是 16 位的，32 位的，64 位的。如果数组里所有的整数都是 16 位长度的，如果新加入一个 32 位的整数，那么整个 16 的数组将升级成一个 32 位的数组。升级可以提升 intset 的灵活性，又可以节约内存，但不可逆。

7.ZSet

ZSet 有序集合对象底层实现可以是 ziplist（压缩列表）或者 skiplist（跳跃表）。

当一个有序集合的元素数量比较多或者成员是比较长的字符串时，Redis 就使用 skiplist（跳跃表）作为 ZSet 对象的底层实现。

typedef struct zskiplist { //  表头节点和表尾节点  struct zskiplistNode *header, *tail; //  表中节点的数量  unsigned long length; //  表中层数 *** 的节点的层数  int level; } zskiplist; typedef struct zskiplistNode { //  成员对象  robj *obj; //  分值  double score; //  后退指针  struct zskiplistNode *backward; //  层  struct zskiplistLevel { //  前进指针  struct zskiplistNode *forward; //  跨度 --- 前进指针所指向节点与当前节点的距离  unsigned int span; } level[]; } zskiplistNode;

zadd—zslinsert— 平均 O(logN), 最坏 O(N)

zrem—zsldelete— 平均 O(logN), 最坏 O(N)

zrank–zslGetRank— 平均 O(logN), 最坏 O(N)