如何使用redis的bit位操作

54次阅读
没有评论

共计 2633 个字符,预计需要花费 7 分钟才能阅读完成。

这篇文章主要介绍“如何使用 redis 的 bit 位操作”的相关知识,丸趣 TV 小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“如何使用 redis 的 bit 位操作”文章能帮助大家解决问题。

本文 redis 试验代码基于如下环境:

操作系统:Mac OS 64 位

版本:Redis 5.0.7 64 bit

运行模式:standalone mode

redis 位操作

reids 位操作也叫位数组操作、bitmap,它提供了 SETBIT、GETBIT、BITCOUNT、BITTOP 四个命令用于操作二进制位数组。

先来看一波基本操作示例

SETBIT

语法:SETBIT key offset value

即:命令 key 偏移量 0/1

setbit 命令用于写入位数组指定偏移量的二进制位设置值,偏移量从 0 开始计数,且只允许写入 1 或者 0,如果写入非 0 和 1 的值则写入失败:

GETBIT

语法:GETBIT key offset

即:命令 key 偏移量

gitbit 命令用于获取位数组指定偏移量上的二进制值:

BITCOUNT

语法:BITCOUNT key

即:命令 key

bitcount 命令用于获取指定 key 的位数组中值为 1 的二进制位的数量,之前我们写入了偏移量 0 的值为 1,偏移量 10 的值为 1,偏移量 8 的值为 0:

BITOP

语法:BITOP operation destkey key [key…]

即:命令 操作 结果目标 key key1 key2 …

bitop 命令可以对多个位数组的 key 进行 and(按位与)、or(按位或)、xor(按位异或)运算,并将运算结果设置到 destkey 中:

底层数据结构分析

SDS 是 redis 中的一种数据结构,叫做简单动态字符串(Simple Dynamic String),并且它是一种二进制安全的,在大多数的情况下 redis 中的字符串都用 SDS 来存储。

SDS 的数据结构:

struct sdshdr { #记录 buff 数组中已使用字节的数量  #也是 SDS 所保存字符串的长度  int len; #记录 buff 数组中未使用字节的数量  int free; # 字节数组,字符串就存储在这个数组里  char buff[]; }

数据存储示例:

图片来源《redis 设计与实现》

SDS 的优点:

鸿蒙官方战略合作共建——HarmonyOS 技术社区

  时间复杂度为 O(1)

  杜绝缓冲区溢出

  减少修改字符串长度时候所需的内存重分配次数

  二进制安全的 API 操作

  兼容部分 C 字符串函数

关于 SDS 的详细介绍请大家参阅《redis 设计与实现》一文。

redis 中的位数组采用的是 String 字符串数据格式来存储,而字符串对象使用的正是上文说的 SDS 简单动态字符串数据结构。

图片来源《redis 设计与实现》

大家都知道的是一个字节用的是 8 个二进制位来存储的,也就是 8 个 0 或者 1,即一个字节可以存储十进制 0~127 的数字,也即包含了所有的数字、英文大小写字母以及标点符号。

1Byte=8bit

1KB=1024Byte

1MB=1024KB

1GB=1024MB

位数组在 redis 存储世界里,每一个字节也是 8 位,初始都是:

0 0 0 0 0 0 0 0

而位操作就是在对应的 offset 偏移量上设置 0 或者 1,比如将第 3 位设置为 1,即:

0 0 0 0 1 0 0 0 # 对应 redis 操作即: setbit key 3 1

在此基础上,如果要在偏移量为 13 的位置设置 1,即:

setbit key 13 1 # 对应 redis 中的存储为: 0 0 1 0 | 0 0 0 0 | 0 0 0 0 | 1 0 0 0

时间复杂度

GETBIT 命令时间复杂度 O(1)

STEBIT 命令时间复杂度 O(1)

BITCOUNT 命令时间复杂度 O(n)

BITOP 命令时间复杂度 O(n)、O(n2)

我们来看 GETBIT 以及 SETBIT 命令的时间复杂度为什么是 O(1),当我们执行一个 SETBIT key 10086 1 的值的时候,reids 的计算方式如下:

获取到要写入位数组中的哪个字节:10086 divide;8=1260,需要写入到位数组的下标 1260 的字节

获取要写入到这个字节的第几位:10086 mod 8 = 6,需要写入到这个字节的下标为 6 即第 7 位上去。

通过这两种计算方式大家可以清晰的看到,位操作的 GETBIT 和 SETBIT 都是常量计算,因此它的时间复杂度为 O(1)。

而 BITCOUNT 命令需要对整个位数组的所有元素进行遍历算出值为 1 的有多少个,当然 redis 对于大数据了的 bit 执行 bitcount 命令会有一整套复杂的优化的算法,但是核心思路还是这个意思,无非是减少部分遍历查询次数。比如以 128 位为一次遍历,那么他的遍历次数就是所有的位数除以 128。

BITTOP 命令则是根据不同的操作有不同的执行方式。比如 AND 操作,则需要查看位值为 1 的即可。

存储空间计算

根据上面的介绍,相信大家已经知道了基于 redis 的位数组数据结构存储的数据占用内存大小是怎么计算的了。比如有 100 亿的数据,那么它需要的字节数组:

1000000000 divide;8 divide;1024 divide;1024 asymp;119.21MB

也就是存储 10 亿的数据只需要 119MB 左右的内存空间,这对于现在动辄 16G、32G 集群版的 redis,完全没有问题。

需要注意的是,如果你的数据量不大,那就不要把起始偏移量搞的很大,这样也是占空间的,比如我们只需要存储几百条数据,但是其中的偏移量却很大,这就会造成了很大的内存空间浪费。

应用场景

实际项目开发中有很多业务都适合采用 redis 的 bit 来实现。

用户签到场景

每天的日期字符串作为一个 key,用户 Id 作为 offset,统计每天用户的签到情况,总的用户签到数

活跃用户数统计

用户日活、月活、留存率等均可以用 redis 位数组来存储,还是以每天的日期作为 key,用户活跃了就写入 offset 为用户 id 的位值 1。

同理月活也是如此。

用户是否在线以及总在线人数统计

同样是使用一个位数组,用户的 id 映射偏移量,在线标识为 1,下线标识为 0。即可实现用户上下线查询和总在线人数的统计

APP 内用户的全局消息提示小红点

现在大多数的 APP 里都有站内信的功能,当有消息的时候,则提示一个小红点,代表用户有新的消息。

关于“如何使用 redis 的 bit 位操作”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注丸趣 TV 行业资讯频道,丸趣 TV 小编每天都会为大家更新不同的知识点。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-15发表,共计2633字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)