Redis入门到通关之数据结构解析-IntSet

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
简介: Redis入门到通关之数据结构解析-IntSet

概述


IntSetRedis中set集合的一种实现方式,基于 整数数组 来实现,并且具备长度可变、有序等特征。

结构如下:

// intset 结构体定义
typedef struct intset {
    uint32_t encoding;   // 编码方式,用于表示存储的整数类型
    uint32_t length;     // intset 中包含的元素个数
    int8_t contents[];   // 存储整数的数组
} intset;

其中的 encoding 包含三种模式,表示存储的整数大小不同:

为了方便查找,Redis 会将 intset 中所有的整数按照 升序 依次保存在contents数组中,结构如图:


IntSet升级


假如现在,数组中每个数字都在 int16_t 的范围内,因此采用的编码方式是 INTSET_ENC_INT16,每部分占用的字节大小为:

encoding:4字节

length:4字节

contents:2字节 * 3 = 6字节

我们向该其中添加一个数字:50000,这个数字超出了 int16_t 的范围,intset 会自动 升级 编码方式到合适的大小。

以当前案例来说流程如下:


  • 升级编码为 INTSET_ENC_INT32, 每个整数占4字节,并按照新的编码方式及元素个数扩容数组
  • 倒序 依次将数组中的元素拷贝到扩容后的正确位置
  • 将待添加的元素放入数组末尾
  • 最后,将 inset 的 encoding 属性改为 INTSET_ENC_INT32 ,将 length 属性改为4


简易源码


#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>

// intset 结构体定义
typedef struct intset {
    uint32_t encoding;   // 编码方式,用于表示存储的整数类型
    uint32_t length;     // intset 中包含的元素个数
    int8_t contents[];   // 存储整数的数组
} intset;

// 创建一个新的 intset
intset *intset_new() {
    intset *is = malloc(sizeof(intset));
    if (!is) return NULL;
    is->encoding = 0;   // 初始编码方式为 0
    is->length = 0;
    return is;
}

// 添加整数到 intset
intset *intset_add(intset *is, int64_t value) {
    // 添加元素的逻辑实现省略
    return is;
}

// 检查整数是否存在于 intset
int intset_contains(const intset *is, int64_t value) {
    // 检查元素是否存在的逻辑实现省略
    return 0;
}

// 删除整数从 intset
intset *intset_remove(intset *is, int64_t value) {
    // 删除元素的逻辑实现省略
    return is;
}

// 打印 intset 中的元素
void intset_print(const intset *is) {
    printf("Intset Length: %d\n", is->length);
    printf("Intset Elements: ");
    for (int i = 0; i < is->length; ++i) {
        printf("%lld ", (long long)is->contents[i]);
    }
    printf("\n");
}

int main() {
    intset *is = intset_new();
    if (!is) {
        printf("Error: Unable to create intset.\n");
        return 1;
    }

    is = intset_add(is, 5);
    is = intset_add(is, 10);
    is = intset_add(is, 15);

    intset_print(is);

    // 检查元素是否存在
    if (intset_contains(is, 10)) {
        printf("Element 10 exists in the intset.\n");
    } else {
        printf("Element 10 does not exist in the intset.\n");
    }

    is = intset_remove(is, 10);
    intset_print(is);

    free(is);
    return 0;
}


总结


Intset可以看做是特殊的整数数组,具备一些特点:

  • Redis会确保Intset中的元素唯一、有序
  • 具备类型升级机制,可以节省内存空间
  • 底层采用二分查找方式来查询
相关文章
|
16天前
|
存储 消息中间件 NoSQL
Redis数据结构:List类型全面解析
Redis数据结构——List类型全面解析:存储多个有序的字符串,列表中每个字符串成为元素 Eelement,最多可以存储 2^32-1 个元素。可对列表两端插入(push)和弹出(pop)、获取指定范围的元素列表等,常见命令。 底层数据结构:3.2版本之前,底层采用**压缩链表ZipList**和**双向链表LinkedList**;3.2版本之后,底层数据结构为**快速链表QuickList** 列表是一种比较灵活的数据结构,可以充当栈、队列、阻塞队列,在实际开发中有很多应用场景。
|
21天前
|
存储 消息中间件 NoSQL
Redis 数据结构与对象
【10月更文挑战第15天】在实际应用中,需要根据具体的业务需求和数据特点来选择合适的数据结构,并合理地设计数据模型,以充分发挥 Redis 的优势。
54 8
|
17天前
|
缓存 前端开发 JavaScript
"面试通关秘籍:深度解析浏览器面试必考问题,从重绘回流到事件委托,让你一举拿下前端 Offer!"
【10月更文挑战第23天】在前端开发面试中,浏览器相关知识是必考内容。本文总结了四个常见问题:浏览器渲染机制、重绘与回流、性能优化及事件委托。通过具体示例和对比分析,帮助求职者更好地理解和准备面试。掌握这些知识点,有助于提升面试表现和实际工作能力。
51 1
|
20天前
|
存储 NoSQL Java
介绍下Redis 的基础数据结构
本文介绍了Redis的基础数据结构,包括动态字符串(SDS)、链表和字典。SDS是Redis自实现的动态字符串,避免了C语言字符串的不足;链表实现了双向链表,提供了高效的操作;字典则类似于Java的HashMap,采用数组加链表的方式存储数据,并支持渐进式rehash,确保高并发下的性能。
介绍下Redis 的基础数据结构
|
1月前
|
存储 消息中间件 NoSQL
Redis 入门 - C#.NET Core客户端库六种选择
Redis 入门 - C#.NET Core客户端库六种选择
56 8
|
1月前
|
消息中间件 存储 缓存
redis支持的数据结构
redis支持的数据结构
29 2
|
16天前
|
存储 NoSQL 关系型数据库
Redis的ZSet底层数据结构,ZSet类型全面解析
Redis的ZSet底层数据结构,ZSet类型全面解析;应用场景、底层结构、常用命令;压缩列表ZipList、跳表SkipList;B+树与跳表对比,MySQL为什么使用B+树;ZSet为什么用跳表,而不是B+树、红黑树、二叉树
|
16天前
|
存储 NoSQL Redis
Redis常见面试题:ZSet底层数据结构,SDS、压缩列表ZipList、跳表SkipList
String类型底层数据结构,List类型全面解析,ZSet底层数据结构;简单动态字符串SDS、压缩列表ZipList、哈希表、跳表SkipList、整数数组IntSet
|
1月前
|
存储 机器学习/深度学习 算法
探索数据结构:入门及复杂度的解锁
探索数据结构:入门及复杂度的解锁
|
1月前
|
NoSQL Redis C++
Redis的实现五:二叉堆的数据结构和TTL、c,c++的实现
这篇文章详细探讨了二叉堆的数据结构及其在C和C++中的实现,特别强调了二叉堆在Redis中实现TTL(生存时间)功能的重要性,并通过代码示例展示了如何在Redis中使用二叉堆来管理键的过期时间。
38 0

热门文章

最新文章

推荐镜像

更多