redis源码学习

本文涉及的产品
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
简介: redis源码学习



redis源码学习

wsl2安装

https://docs.microsoft.com/zh-cn/windows/wsl/install-win10

vscode

https://docs.microsoft.com/zh-cn/windows/wsl/tutorials/wsl-vscode

c/c++基本配置

https://code.visualstudio.com/docs/cpp/config-wsl

建议学习方法

  1. 首先定一个小的主题,预期要得到的效果;
  2. 准备测试数据以及调试环境;
  3. 查看流程,把每一个细支流程拷贝出来;并在旁边写上注释;
  4. 得出结论;

字典实现

redis DB KV组织是通过字典来实现的;hash结构当节点超过 512 个或者单个字符串长度大于64 时,hash结构采用字典实现;

数据结构:

typedef struct dictEntry
{
    void *key;
    union
    {
        void *val;
        uint64_t u64;
        int64_t s64;
        double d;
    } v;
    struct dictEntry *next;
} dictEntry;
typedef struct dictht
{
    dictEntry **table;
    unsigned long size;// 数组长度
    unsigned long sizemask; //size-1
    unsigned long used;//当前数组当中包含的元素
} dictht;
typedef struct dict
{
    dictType *type;
    void *privdata;
    dictht ht[2];
    long rehashidx; /* rehashing not in progress if rehashidx == -1 */
    int16_t pauserehash; /* If >0 rehashing is paused (<0 indicates coding error) 用于安全遍历*/
} dict;
  1. 字符串经过hash函数运算得到64位整数;
  2. 相同字符串多次通过hash函数得到相同的64位整数;
  3. 整数对2的n次幂取余可以转化为位运算;
  4. 抽屉原理 n+1个苹果放在n个抽屉中,苹果最多的那个抽屉至少有2个苹果;64位整数远大于数组的长度,比如数组长度为4,那么1、5、9、1+4n都是映射到1号位数组;所以大概率会发生冲突;

冲突

负载因子

负载因子 = used / size ; used 是数组存储元素的个数, size 是数组的长度;

负载因子越小,冲突越小;负载因子越大,冲突越大;

redis的负载因子是 1 ;

扩容

如果负载因子 > 1 ,则会发生扩容;扩容的规则是翻倍;

如果正在 fork (在rdb、aof复写以及rdb-aof混用情况下)时,会阻止扩容;但是此时若负载因子 > 5 ,索引效率大大降低, 则马上扩容;这里涉及到写时复制原理;

写时复制

写时复制核心思想:只有在不得不复制数据内容时才去复制数据内容;

缩容

如果负载因子 < 0.1 ,则会发生缩容;缩容的规则是恰好包含 used 的 ;

恰好的理解:假如此时数组存储元素个数为9,恰好包含该元素的就是 ,也就是 16;

渐进式rehash

当 hashtable 中的元素过多的时候,不能一次性 rehash 到 ht[1] ;这样会长期占用 redis ,其他命令得不到响应;所以需要使用渐进式 rehash ;

rehash步骤: 将 ht[0] 中的元素重新经过hash函数生成64位整数,再对 ht[1] 长度进行取余,从而映射到ht[1] ;

渐进式规则: 1. 分治的思想,将 rehash 分到之后的每步增删改查的操作当中;

2. 在定时器中,最大执行一毫秒 rehash ;每次步长 100 个数组槽位;

面试

处于渐进式rehash阶段时,是否会发生扩容缩容?不会!

scan(间断)

提出疑问:扩容的情况 4 scan 0

scan cursor [MATCH pattern] [COUNT count] [TYPE type]

采用高位进位加法的遍历顺序, rehash 后的槽位在遍历顺序上是相邻的;

遍历目标是:不重复,不遗漏 ;

expire机制

# 只支持对最外层key过期; 
expire key seconds 
pexpire key milliseconds 
ttl key 
pttl key

惰性删除

分布在每一个命令操作时检查 key 是否过期;若过期删除 key ,再进行命令操作;

定时删除

在定时器中检查库中指定个数(25)个 key;

#define ACTIVE_EXPIRE_CYCLE_KEYS_PER_LOOP 20
/* Keys for each DB loop. */ /*The default effort is 1, and the maximum configurable effort * is 10. */
config_keys_per_loop = ACTIVE_EXPIRE_CYCLE_KEYS_PER_LOOP + ACTIVE_EXPIRE_CYCLE_KEYS_PER_LOOP/4*effort, int activeExpireCycleTryExpire(redisDb *db, dictEntry *de, long long now);

大KEY

在redis实例中形成了很大的对象,比如一个很大的hash或很大的zset,这样的对象在扩容的时候,会一次性申请更大的一块内存,这会导致卡顿;如果这个大key被删除,内存会一次性回收,

卡顿现象会再次产生;

如果观察到redis的内存大起大落,极有可能因为大key导致的;

# 每隔0.1秒 执行100条scan命令 
redis-cli -h 127.0.0.1 --bigkeys -i 0.1

跳表实现

跳表(多层级有序链表)结构用来实现有序集合;鉴于redis需要实现 zrange 以及 zrevrange功能;需要节点间最好能直接相连并且增删改操作后结构依然有序;

理想跳表

每隔一个节点生成一个层级节点;模拟二叉树结构;

但是如果对理想跳表结构进行删除增加操作,很有可能改变跳表结构;如果重构理想结构,将是巨大的运算;考虑用概率的方法来进行优化;从每一个节点出发,每增加一个节点都有 的概率增加一个层级, 的概率增加两个层级, 的概率增加3个层级,以此类推;经过证明,当数据量足够大(256)时,通过概率构造的跳表趋向于理想跳表,并且此时如果删除节点,无需重构跳表结构,此时依然趋向于理想跳表;

redis跳表

从节约内存出发,redis 考虑牺牲一点时间复杂度让跳表结构更加变扁平,就像二叉堆改成四叉堆结构;并且redis 还限制了跳表的最高层级为 32 ;

节点数量大于 128 或者有一个字符串长度大于 64 ,则使用跳表( skiplist );

数据结构

#define ZSKIPLIST_MAXLEVEL 32 /* Should be enough for 2^64 elements */
#define ZSKIPLIST_P 0.25 /* Skiplist P = 1/4 */
/* ZSETs use a specialized version of Skiplists */
typedef struct zskiplistNode
{
    sds ele;
    double score; // WRN: score 只能是浮点数
    struct zskiplistNode *backward;
    struct zskiplistLevel
    {
        struct zskiplistNode *forward;
        unsigned long span; // 用于 zrank
    } level[];
} zskiplistNode;
typedef struct zskiplist
{
    struct zskiplistNode *header, *tail;
    unsigned long length; // zcard
    int level; // 最高层
} zskiplist;
typedef struct zset
{
    dict *dict; // 帮助快速索引到节点
    zskiplist *zsl;
} zset;

结构图

应用

延时队列优化

前面实现的延时队列有很大的局限性;

  1. 时间基准问题;两个应用程序如何保证时间一致;
  2. 异步轮询的问题;耗性能,大量无意义的数据请求;
  3. 原子性的问题;需要引入lua脚本来执行;

解决:

  1. 以redis的时间为基准,redis为数据中心且为单点,时间准确性得到大幅提升;
  2. 通过阻塞接口来实现,避免轮询;
  3. 修改源码,直接实现原子接口;
思路
# 在redis当中 zset结构 score = time + 5
dq_add "delay_queue" 5 msg
# 如果没有消息pop,则将此连接加入阻塞队列,然后在redis的定时器中 比较 zset 最小的值与当前time的大小 如果满足条件,通知阻塞队列中的连接;
dq_bpop "delay_queue" timeout 60
相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore &nbsp; &nbsp; ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库&nbsp;ECS 实例和一台目标数据库&nbsp;RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&amp;RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
29天前
|
存储 NoSQL 算法
【Redis技术进阶之路】「底层源码解析」揭秘高效存储模型与数据结构底层实现(字典)(二)
【Redis技术进阶之路】「底层源码解析」揭秘高效存储模型与数据结构底层实现(字典)
47 0
|
3月前
|
NoSQL 中间件 API
分布式锁【数据库乐观锁实现的分布式锁、Zookeeper分布式锁原理、Redis实现的分布式锁】(三)-全面详解(学习总结---从入门到深化)(下)
分布式锁【数据库乐观锁实现的分布式锁、Zookeeper分布式锁原理、Redis实现的分布式锁】(三)-全面详解(学习总结---从入门到深化)
82 2
|
3月前
|
NoSQL Java API
分布式锁【数据库乐观锁实现的分布式锁、Zookeeper分布式锁原理、Redis实现的分布式锁】(三)-全面详解(学习总结---从入门到深化)(上)
分布式锁【数据库乐观锁实现的分布式锁、Zookeeper分布式锁原理、Redis实现的分布式锁】(三)-全面详解(学习总结---从入门到深化)
74 0
|
9天前
|
人工智能 前端开发 Java
Java语言开发的AI智慧导诊系统源码springboot+redis 3D互联网智导诊系统源码
智慧导诊解决盲目就诊问题,减轻分诊工作压力。降低挂错号比例,优化就诊流程,有效提高线上线下医疗机构接诊效率。可通过人体画像选择症状部位,了解对应病症信息和推荐就医科室。
151 10
|
1月前
|
存储 NoSQL 网络协议
读懂Redis源码,我总结了这7点心得
读懂Redis源码,我总结了这7点心得
|
1月前
|
存储 NoSQL Java
【Redis】1、学习 Redis 的五大基本数据类型【String、Hash、List、Set、SortedSet】
【Redis】1、学习 Redis 的五大基本数据类型【String、Hash、List、Set、SortedSet】
54 0
|
2月前
|
存储 NoSQL 算法
学习 Redis 基础数据结构,不讲虚的。
职场中是这样使用 redis 的。
154 1
学习 Redis 基础数据结构,不讲虚的。
|
2月前
|
NoSQL Java API
分布式锁【数据库乐观锁实现的分布式锁、Zookeeper分布式锁原理、Redis实现的分布式锁】(三)-全面详解(学习总结---从入门到深化)
分布式锁【数据库乐观锁实现的分布式锁、Zookeeper分布式锁原理、Redis实现的分布式锁】(三)-全面详解(学习总结---从入门到深化)
298 0
|
3月前
|
缓存 NoSQL 关系型数据库
Redis 7.0 源码调试环境搭建与源码导读技巧
Redis 7.0 源码调试环境搭建与源码导读技巧
54 0
|
3月前
|
存储 NoSQL Java
深入学习Redis:从入门到实战
深入学习Redis:从入门到实战

热门文章

最新文章