Redis的开发规范和常见问题 --晓翌

本文涉及的产品
云数据库 MongoDB,独享型 2核8GB
推荐场景:
构建全方位客户视图
云数据库 Redis 版,标准版 2GB
推荐场景:
搭建游戏排行榜
云原生内存数据库 Tair,内存型 2GB
简介: 目录一、Redis – 从问题说起二、Redis – 不要触碰边界三、Redis – 阿里内部开发规约四、Redis – 常见问题处理

目录

一、Redis – 从问题说起

二、Redis – 不要触碰边界

三、Redis – 阿里内部开发规约

四、Redis – 常见问题处理

 

一、Redis – 从问题说起

1Run-to-Completion in a solo thread Redis最大的问题

Redis最大的问题是后台主要线程是一个单线程,如下图所示,用户所有的来自不同client的请求,实际上在每个event到来后,交由后端单线程执行。等每个event处理完成后,才处理下一个;单线程run-to-completion 就是没有dispatcher,没有后端的multi-worker。所以如果慢查询,诸如单机版的keyslrangehgetall等拖慢了一次查询,那么后面的请求就会被拖慢。

image.png

使用Sentinel判活的trick

Ping命令判活:ping命令同样受到慢查询影响,如果引擎被卡住,则ping失败;

Duplex Failuresentinel由于慢查询切备(备变主)再遇到慢查询,Redis将出现OOS

 

2)扩展为集群版,问题可解?

既然一个Redis进程不行,采用分布式方案扩展成集群版可以吗?集群板确实能解决一部分问题,常见的请求是可以分散到不同DB上的。

但是,集群版也还是解决不了单个DB被卡住的问题,因为Rediskey hash规则是按照外面的一层PK来做的,没有按照里面的子key或者是field的来做,如果用户调用了跨分片的命令,如mget,访问到出问题的db,仍会block住,问题还是会存在。

image.png

3Protocol问题 – 大量客户端与引擎Fully-Meshed问题

采用Redis协议(RESP)的问题:

• 扩展性太差:基于Question-Answer模式,由于在Question/Answer里面没有对应的Sequence的存在,(如果不做复杂的转换wrapper)存储引擎端没法match请求和响应,只能采用Run-To-Completion来挂住链接;

image.png

C10K的问题:当引擎挂住太多active链接的时候,性能下降太多。测试结果是当有10k active连接时,性能下降30-35%,由于引擎端挂住的链接不能被返回,用户大量报错。

image.png

4)“Could not get a resource from the pool”

如下图所示,由于Redis执行Run-To-Completion特性,客户端只能采用连接池的方案;Redis协议不支持连接池收敛,是因为Message没有ID,所以RequestResponse对不起来。连接池具体运作方式是每次查询,都要先从连接池拿出一根连接来,当服务端返回结果后,再放回连接池。

image.png

如果用户返回的及时,那么连接池一直保有的连接数并不高,但是一旦服务端未及时返回,客户端又有新的请求,就只能再checkout一根连接。

Engine层出现慢查询,就会让请求返回的慢,造成的后果是很容易让用户把连接池用光,当应用机器特别多的情况,按每个client 连接池50max link来算,很容易打到10K链接的限制,导致engine回调速度慢。

当连接池被checkout完,就会爆没有连接的异常:"Could not get a resource from the pool",这是非常常见的错误,有恶性循环的逻辑在里面。比如说服务端返回的慢,连接池的连接就会创建的很快,用户很容易达到1万条,创建的连接越多,性能越差,返回越慢,服务容易血崩。

 

二、Redis – 不要触碰边界

Redis的边界

--红色区域代表危险

上述罗列的问题,是为了让我们在开发业务的时候,不要触碰Redis的边界。下面从计算、存储、网络三个维度出发,总结了这张图:

image.png

计算方面:WildcardLua并发、1N PUBSUB、全局配置/热点,会大量消耗计算资源(高计算消耗);

存储方面:Streaming慢消费、Bigkey等,造成高存储消耗。

网络方面:Keys等扫全表、Huge Batch mget/mset、大ValueBigkey Range (如hgetallsmembers),造成高网络消耗。

Redis的边界总结:

• 高并发不等于高吞吐

• 大 Value 的问题:高速存储并不会有特别大的高吞吐收益,相反会很危险;

• 数据倾斜和算力倾斜

bigKey 的问题:break掉存储的分配律;

• 热点的问题,本质上是cpu上的分配律不满足;

• 大 Range 的问题:对NoSQL的慢查询和导致的危害没有足够的重视。

• 存储边界

Lua使用不当造成的成本直线上升;

• 数据倾斜带来的成本飙升,无法有效利用;

• 对于 Latency 的理解问题(RT高)

• 存储引擎的 Latency都是P99 Latency,如:99.99%1ms以内,99.5%3ms以内,等;

• 偶发性时延高是必然的。这个根因在于存储引擎内部的复杂性和熵。

 

三、Redis – 阿里内部开发规约

Redis的使用建议:

推荐:

• 确定场景,是缓存(cache还是存储型

Cache的使用原则是:“无它也可,有它更强”;

• 永远不要强依赖Cache,它会丢,也会被淘汰;

• 优先设计合理的数据结构和逻辑

• 设计避免bigKey,就避免了80%的问题;

Keyspace能分开,就多申请几个Redis实例;

pubsub不适合做消息分发

• 尽量避免用lua做事务。

不建议:

• 我的服务对RT很敏感。 >> RT能让我的服务运行的更好;

• 我把存储都公用在一个redis里。>> 区分cache和内存数据库用法,区分应用;

• 我有一个大排行榜/大集合/大链表/消息队列;我觉得服务能力足够了。 >> 尽量拆散,服务能力不够可通过分布式集群版可以打散;

• 我有一个特别大的Value,存在redis里,访问能好些。>> redis吞吐量有瓶颈。

 

1)BigKey – 洪水猛兽

BigKey,我们称之为洪水猛兽,据初步统计,80%问题由bigKey导致。如下图所示:集群中有4个分片,每个分片大约有102key,实际上是均匀分布。图中第三个key key301hash301,中间有一个放了200w hash,但因为根据hash301打散的这个key是个 bigkey,严重造成数据倾斜。

image.png

别的key只用了10%20%的内存,key301用了约80%,而且大概率是热点。上图的使用用法,有可能造成有一个分片内存满了,访问出了问题,但是其他分片却用的很闲。问题分片的访问比较热,造成网卡打满,或者CPU打满,导致限流,服务可能就夯住了。

 

2)Redis LUA JIT

下面的示意图表示了一次脚本的执行过程,客户端调用EVAL script之后会产生SCRIPT Load的行为,Lua JIT开始编译生成字节码,这时产生一个SHA字符串,表示 bytecode的缓存。Loading bytecode之后,开始执行脚本,还需要保证在副本上执行成功,最后unloadCleaning,整个过程结束。

image.png

示意图中有3个火形图标,表示耗费CPU的程度,脚本的compile-load-run-unload非常耗费CPU。整个lua相当于把复杂事务推送到Redis中执行,如果稍有不慎CPU会爆,引擎算力耗光后挂住redis

对上述的情况,Redis做了一些优化,比如“Script + EVALSHA”,可以先把脚本在redis中预编译和加载(不会unloadclean),使用EVALSHA执行,会比纯EVALCPU,但是Redis重启/切换/变配 bytecode cache会失效,需要reload,仍是缺陷方案。建议使用复杂数据结构,或者module来取代lua

• 对于JIT技术在存储引擎中而言,“EVAL is evil”,尽量避免使用lua耗费内存和计算资源(省事不省心);

• 某些SDK(如Redisson)很多高级实现都内置使用lua,开发者可能莫名走入CPU运算风暴中,须谨慎。

 

3Pubsub/Transaction/Pipeline

Pubsub的典型场景

Pubsub适合悲观锁简单信号,不适合稳定的更新,因为可能会丢消息。在1N的消息转发通道中,服务瓶颈。还有模糊通知方面,算力瓶颈。在channelclient比较多的情况下,造成CPU打满、服务夯住。

Transaction

Transaction是一种伪事物,没有回滚条件;集群版需要所有key使用hashtag保证,代码比较复杂,hashtag也可能导致算力和存储倾斜;Lua中封装了multi-exec,但更耗费CPU,比如编译、加载时,经常出现问题。

Pipeline

Pipeline用的比较多,如下面的示意图,实际上是把多个请求封装在一个请求中,合并在一个请求里发送,服务端一次性返回,能够有效减少IO,提高执行效率。需要注意的是,用户需要聚合小的命令,避免在pipeline里做大range。注意Pipeline中的批量任务不是原子执行的(从来不是),所以要处理Pipeline其中部分命令失败的场景。

image.png

4KEYS命令

KEYS 命令,一定会出问题,即使当前没有,客户数据量上涨后必然引发慢查,出现后无能为力。这种情况,需要在一开始就提前预防,可以在控制台通过危险命令禁用,禁止掉keys命令,出现时也可以使用一些手段优化。

KEYS命令的模糊匹配:

·Redis存储key是无序的,匹配时必然全表扫描, key数目一多必然卡住,所以一定要去优化。

如下图所例子中所示,修改为hash结构:

·可以从全表扫描变为点查/部分range, 虽然hash结构中field太多也会慢,但比keys性能提升一个到两个数量级。

这个例子里面, Product1前缀可以提取成为hashKEY,如果要去product1前缀的所有东西,其实可以下发一个HGETALL,这样的就是优化了。

image.png

5)除去KEYS,下面命令依然危险

hgetallsmemberslrangezrangeexhgetall

• 直接与数据结构的subkeyfield)多少相关,O(n),携带value爆网卡。

• 建议使用scan来替代。

bitopbitset

• 设置过远的bit会直接导致OOM

flushallflushdb

• 数据丢失。

用户在操作的时候,需要很小心,因为会清空数据库。在阿里云Redis控制台里面点清除数据时,需要使用二次校验,避免随意清除数据。另外还可以单独清理过期数据,对其他正常访问的数据没有影响。

• 配置中和ziplist相关的参数

Redis在存储相关数据结构时,数据量比较小,底层使用了ziplist结构,达到一定的量级,比如key/field变多了,会转换数据结构。当结构在ziplist结构体下时,算力开销变大,部分查询变O(n)级别,匹配变O(m*n),极端情况容易打满CPU,不过占用的内存确实变少了(需要评估带来的收益是否匹配付出的代价?)。

•建议用户尽量使用默认参数。

 

规范总结 [Just FYI]

1.选型:用户需要确定场景是cache还是内存数据库使用

Cache场景,关闭AOF;内存数据库选择双副本

• 如果keyspace能够分开,就申请不同的实例来隔离

2.使用:避免触发高速存储的边界

set/hash/zset/list/tairhash/bloom/gis等大key(内部叫做godkey)不要超过3000,会记录sillylog

• 避免使用keyshgetalllrange0-1等大range(使用scan替代)

• 避免使用大value10k以上就算大value50k会记录)

3.SDK:使用规范

• 严禁设置低读超时和紧密重试(建议设置200ms以下read timeout

• 需要接受P99时延,对超时和慢做容错处理

• 尽量使用扩展数据结构,避免使用lua

• 尽量避免pubsubblockingAPI

4.接受主动运维

在阿里云上,如果机器宕机,或者是机器后面有风险,我们会做主动运维保证服务的稳定性。

 

四、Redis – 常见问题处理

1Tair/Redis内存模型

内存控制是Redis的精华部分,大部分遇到的问题都是跟内存有,Tair/Redis内存模型,如下图所示,总内存分为3个部分:链路内存(动态)、数据内存、管理内存(静态)

·链路内存(动态):主要包括Input buffOutput buff等,Input buffOutput buff跟每个客户端的连接有关系,正常情况下比较小,但是当Range操作的时候,或者有大key收发比较慢的时候,这两个区的内存会增大,影响数据区,甚至会造成OOM。还包括JIT OverheadFake Lua Link,包含了Code cache执行缓存等等。

·数据内存:用户数据区,就是用户实际存储的value

·管理内存(静态):是静态buff,启动的时候比较小,比较恒定。这个区域主要管理datahash开销,当 key非常多的时候,比如几千万、几个亿,会占用非常大的内存。还包括Repl-buffaof-buff32M64M)通常来说比较小。

image.png

总内存 = 链路内存 (动态) + 数据内存 + 管理内存(静态)

 

OOM场景,大都是动态内存管理失效,例如限流的影响(plus timer mem),限流的时候请求出不去,导致请求堆积后动态内存极速飙升,造成OOM;无所畏惧的Lua脚本也有可能造成OOM

原生的Redis被定义为“缓存”,在动态内存上控制比较粗糙。Tair对这部分做了加强,致力于footprint control,售卖内存接近User Dataset

 

2)缓存分析 – 内存分布统计、bigKeykey pattern

对于内存,阿里云有现成的功能一键分析,使用入口在“实例管理”-》“CloudDBA”下面的“缓存分析”,热Key分析无需主动触发。数据源支持历史备份集,现有备份集,可以准实时或者对历史备份做分析。支持线上所有的社区版和企业版。也支持线上所有的架构,包括标准版、读写分离版、集群版。

• 使用入口

• “实例管理” -->CloudDBA --> “缓存分析” --> “立即分析”;热Key分析无需主动触发。

• 数据源

• 支持已有备份集;

• 支持自动新建备份集。

• 支持版本

• 社区版(2.8~6.0);

• 企业版(Tair)。

• 支持架构

• 标准版;

• 读写分离版;

• 集群版。

下图所示,是阿里云控制台使用截图,这个功能比较常用,已开放OpenApi,可被集成。

image.png

下图所示,是缓存分析报告,可以看到每一个DB内存分布统计,包括不同类型的数据结构内存统计,key对应的元素数分级统计,可以统计到总体上大概有多少个大key;统计 key过期时间分布,可以发现过期时间设置的是否合理。 Top 100 BigKey(按内存),可以发现具体有哪些大key,业务上可以参照这个做优化。 Top 100 BigKey前缀是做了key pattern统计,如果key是按照业务模块来制定的前缀,可以统计到各个业务上用了多少内存,也可以大体上指导业务优化。

image.png

3)热Key分析

阿里云提供了在线离线两种热Key分析方式:

• 在线实时分析热key

• 使用入口:“实例管理”--> CloudDBA --> “缓存分析” -->

HotKey”

• 使用须知:Tair版,或Redis版本>=redis4.0

• 精确统计(非采样),能抓出当前所有 Per Key QPS > 3000的记录;

• 参考文档:https://help.aliyun.com/document_detail/160585.html

• 离线分析热key

• 方法1:缓存分析也可以分析出相对较热的key,通过工具实现;

• 方法2:最佳实践,imonitor命令 + redis-faina 分析出热点Key

• 方法3:使用审计日志查询历史热Key,参考文档

https://help.aliyun.com/document_detail/181195.html

image.png

4Tair/Redis全链路诊断

Tair/Redis全链路诊断,从“APP端的SDK”到“网络”到“VIP”到“Proxy”再到“DB”,每个部分都有可能会出问题。

问题排查包括:前端排查后端排查。前段排查首先需要确定是一台出问题,还是全部有问题,如果是一台出问题,大概率是客户端自己的问题,包括:

ECS

1. Load,内存等;

2. PPS限制。

• 客户端

1. 链接池满;

2. RT高(跨地域,gc等);

3. 建链接慢(K8s DNS等);

4. 大查询,发快收慢。

• 网络

1. 丢包,收敛;

2. 运营商网络抖动。

后端排查:主要是慢查和CPU排查,包括“VIP”、“ Proxy”、“DB”。 Tair/Redis 80%的问题是RTlatency)相关。

VIPSLB/NGLB

1. 建链接瓶颈(极少);

2. 流量不均衡(少);

3. 流量瓶颈(极少)。

Proxy

1. 分发慢查;

2. 流量高(扩容proxy);

3. 消息堆积;

4. Backend网络抖动。

DB

1. 容量,CPU,流量(见前文);

2. 主机故障,HA速度;

3. 慢查询。

image.png

5Tair/Redis诊断报告

对于全链路诊断,我们推出了诊断报告功能,可以对某个时间段发起“一键诊断”,这里主要是后端排查,目前都是“DB”相关,可以看到有哪些异常情况发生。如下图所示:

核心曲线:核心指标的曲线,可以看哪些时间点,哪些节点有峰值。

慢请求:展示了Top 10节点的Top 10慢命令统计;

性能水位:可以看到哪些指标、哪些节点超过了预设水位,或者是这些节点是不是发生了倾斜,对发现问题有很大的帮助。

诊断:准实时的对过去最近半小时,1小时,或者对过去某一天、某几天的诊断。目前还没有完全对外开放,如果有兴趣,可以在阿里云上提工单,我们会单独开放访问。

image.png

6Tair/Redis慢日志

• 设置合理的ProxyDB慢日志采集参数

slowlog-log-slower-thanDB分片上慢日志阈值,不可设置过低!;

slowlog-max-lenDB分片slowlog链表最大保持长度;

rt_threshold_msProxy上慢日志阈值,不可设置过低!。

image.png

以上建议使用默认的参数,不要设置过小,因为如果这些阈值设置的过小,那么 DB在采集慢日志的时候会频繁记录,可能造成引擎的性能降低,所以尽量使用默认参数。

慢日志查询功能分为历史慢日志实时慢日志,入口也不相同,区别在于历史慢日志可获取近72小时内的慢日志。实时慢日志能抓出当前所有分片slowlog,但是有一个局限性,如果节点发生了HA或者手动清理慢日志,这部分慢日志就没有了。使用入口如下图所示:

• 历史慢日志

• 使用入口:“实例管理”--> “日志管理” --> “慢日志”;

• 使用须知:Tair版,或Redis版本>=redis4.0,具体查看帮助文档;

• 可获取近72小时内的慢日志。

• 实时慢日志

• 使用入口:“实例管理”--> CloudDBA --> “慢请求”;

• 实时获取,能抓出当前所有分片slowlog

image.png

7)资源的规划 – 自建 VS Redis

采购目标:一个24G Redis主从版。上云方案包括ECS自建RedisRedis服务(Redis/Tair

ECS自建Redis

优点:

• 便宜;

• 拥有最高权限,完全自主可控,操控性强。

缺点

• 不能做到快速弹性的资源创建,业务突发高峰无法快速满足系统性能要求;

• 需要专职DBA甚至是基础架构开发人员长期维护与技术演进;

• 管控节点/平台需要使用第三方工具或额外研发,而且要额外购买资源安装部署;

Redis原生社区版内核无优化;

• 无专家服务兜底。

规格配置:

• 实例规格和数量:

ecs.r6e.xlarge 4 vCPU 32 GiB,内存平衡增强型 r6e);

ecs.g6a.large2 vCPU 8 GiB,通用型 g6a);

• 实例数量: 2 + 3 (管控系统:2*APP+ 数据库主从/Sentinel * 3);

• 部署资源分布:主从各24G,同时按照最普遍情况(见下文计算原理)主从各预留8GB作为COW的资源,另外包含三台服务器作为管控系统的应用服务器与数据库服务器,以及sentinel进程部署。

列表价(/)

2033.6700*2+211.2*3)。

 

 

 

Redis服务(Redis/Tair

优点:

• 开箱即用,随时弹性升降配和产品类型转换;

• 内核优化,如简化集群使用并支持跨SLOTkey操作的Proxy,安全加固,账号权限控制;

• 众多企业级管控增值功能特性,如:高可用无脑裂、账号鉴权体系、操作审计、RDB+AOF备份、5秒监控粒度、全量大key分析、命令读写统计等;

• 性能强需求可选Tair性能增强型:具备多线程(性能是社区版的3倍)和丰富实用的数据结构,同时拥有秒级数据恢复、全球多活等强大功能;

• 成本与大规格强需求可选Tair持久内存型与容量存储型,多种形态存储形态针对不同性能容量要求可以进一步降低成本,并提升数据持久化能力(Tair持久内存型较内存版降成本25%Tair容量存储型较内存版降成本85%);

7*24小时专家服务支持;即使出现重大问题,有阿里云专家在线支持,可以快速止血。

缺点:

• 黑盒子,不开放最高权限。

      规格配置:

       • 版本类型:社区版;

• 版本号:Redis 5.0

• 架构类型:标准版;

• 节点类型:双副本;

• 实例规格:24G标准版。

列表价(/)

1950(成本稍低于自建,如果负载压力满足条件,进一步降低成本可以使用Tair持久内存型,可以进一步降低30%的成本,而使用Tair容量存储型会是ECS自建的1/5成本)。

 

相关实践学习
基于Redis实现在线游戏积分排行榜
本场景将介绍如何基于Redis数据库实现在线游戏中的游戏玩家积分排行榜功能。
云数据库 Redis 版使用教程
云数据库Redis版是兼容Redis协议标准的、提供持久化的内存数据库服务,基于高可靠双机热备架构及可无缝扩展的集群架构,满足高读写性能场景及容量需弹性变配的业务需求。 产品详情:https://www.aliyun.com/product/kvstore     ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
相关文章
|
4月前
|
存储 缓存 NoSQL
在Python Web开发过程中:数据库与缓存,Redis在Web开发中的常见应用场景有哪些?
Redis在Python Web开发中常用于缓存、会话管理、分布式锁、排行榜、消息队列和实时分析。作为内存数据存储,它提供高效的数据结构(如字符串、哈希、列表、集合、有序集合),支持会话存储、互斥操作、计数与排名、队列实现及实时数据处理。其高速性能和丰富功能使其成为多场景下的理想选择。
61 5
|
4月前
|
NoSQL API Redis
最佳实践|如何使用c++开发redis module
本文将试着总结Tair用c++开发redis module中遇到的一些问题并沉淀为最佳实践,希望对redis module的使用者和开发者带来一些帮助(部分最佳实践也适用于c和其他语言)。
76556 0
|
2月前
|
NoSQL API Redis
c++开发redis module问题之为什么在使用RedisModule_GetApi之前要通过((void**)ctx)[0]这种方式获取其地址
c++开发redis module问题之为什么在使用RedisModule_GetApi之前要通过((void**)ctx)[0]这种方式获取其地址
|
2月前
|
Rust NoSQL API
c++开发redis module问题之如果在加载module时,该module没有执行权限,Redis会如何解决
c++开发redis module问题之如果在加载module时,该module没有执行权限,Redis会如何解决
|
2月前
|
存储 缓存 NoSQL
Redis 缓存常见问题
Redis 缓存常见问题
34 3
|
2月前
|
编解码 NoSQL Redis
c++开发redis module问题之想实现Redis命令,如何解决
c++开发redis module问题之想实现Redis命令,如何解决
|
2月前
|
NoSQL Java 编译器
c++开发redis module问题之保证Redis在fork时没有处于inflight状态的命令,如何解决
c++开发redis module问题之保证Redis在fork时没有处于inflight状态的命令,如何解决
|
2月前
|
NoSQL 编译器 Redis
c++开发redis module问题之如果Redis加载了多个C++编写的模块,并且它们都重载了operator new,会有什么影响
c++开发redis module问题之如果Redis加载了多个C++编写的模块,并且它们都重载了operator new,会有什么影响
|
2月前
|
NoSQL Redis C++
c++开发redis module问题之在复杂的Redis模块中,特别是使用第三方库或C++开发时,接管内存统计有哪些困难
c++开发redis module问题之在复杂的Redis模块中,特别是使用第三方库或C++开发时,接管内存统计有哪些困难
|
2月前
|
运维 NoSQL Redis
c++开发redis module问题之module根据Redis的角色采取不同的行为,如何解决
c++开发redis module问题之module根据Redis的角色采取不同的行为,如何解决

相关产品

  • 云数据库 Tair(兼容 Redis)