CacheCloud学习

本文涉及的产品
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云原生内存数据库 Tair,内存型 2GB
简介: CacheCloud作为一款可视化方便管理redis的开源软件,可以方便redis集群的管理、开发、监控、运维管理,下面就CacheCloud的代码进行一些整理和学习

一、如何实现可视化工具方便redis操作管理

如果基于redis,如何设计一款工具,方便redis安装、使用、运维、告警、迁移的问题?需要从下面几个方面进行考虑:


1.方便申请
2.方便安装
3.方便使用
4.进行告警
5.自动运维
6.方便数据迁移
7.弹性伸缩

也即需要实现上面的这些功能。


二、开源项目CacheCloud

基于上面的这些功能:搜狐开源的CacheCloud实现了上面的这些功能:

官方的功能架构图

CacheCloud功能架构

根据提供的功能,它分为两部分:

服务端CacheCloud:方便运维、申请、告警、数据迁移、扩缩容

客户端cachecloud-client:方便业务系统调用使用,同时对redis的相关api进行了封装和jedis数据指标上报。

CacheCloud界面

分为后台管理、我的工单、应用列表

1)后台管理:


2)我的工单:

申请工单前需要在后台管理的用户管理里面添加好用户信息。


3)应用列表:


用户可以创建工单,工单中包含的功能:申请应用、导入应用、数据清理、下线应用、数据迁移、诊断应用、键值分析(bigkey的问题等)、扩缩容、修改应用配置、修改报警、数据分析清理等。


三、相关操作过程

1.启动项目

我们可以看到有四个定时任务执行比较频繁:

taskExecuteJob
InstanceAlertValueJob
BrevitySchedulerJob
DispatcherBrevityScheduleJob

其中

TaskExecuteJob是执行taskQueue中的任务
InstanceAlertValueJob是监控所有Redis上一分钟状态
BrevitySchedulerJob则维护全量定时任务逻辑,维护节点和机器
DispatcherBrevityScheduleJob 获取短频任务bean,然后执行定时任务转发,
                             其核心实现asyncSubTaskIds,执行相关数据的采集上报和统计

其中我们可以看到与诊断、监控告警的代码很多,主要这方面的指标信息比较多。可以从数据库看到定时任务执行的频率:

从这里可以看到相关task执行的频率:


2.执行工单申请

我们可以在我的申请中,申请一个redis应用的工单


3.执行工单审批

工单申请后,会在后台管理的审批列表中,看到对应的审批信息:


后台用户审批通过后,即可进行部署:

审批的过程中,会生成部署预览,生成成功后,即可进行部署,如果当前的申请不满足条件,则可以进行驳回。此时会调用doAddAppDeployTask执行部署。部署的过程:

1.保存应用信息
2.获取Redis版本信息
3.根据应用类型获取部署拓扑信息,部署对应的task,此时会根据task类型会先获取应用信息,
  然后生成并保存taskqueue,新增审批信息审核记录

其中部署对应的task类型:

redis cluster
sentinel + redis
standalone
twemproxy + redis
sentinel + pika
twemproxy + pika

此时定时任务task已经保存到了数据库表task_queue表中,因此只需要执行task即可。而触发task_queue中task执行的则是taskExecuteJob。从数据库中可以看到taskExecuteJob的执行频率是非常频繁的,每10秒钟会触发一下。

4.taskExecuteJob执行taskQueue触发

在com.sohu.cache.task.impl.TaskServiceImpl#executeTask这个方法,我们可以看到具体任务的执行情况。执行的过程如下:

获取具体的队列task,进行判空和状态
更新task队列任务执行的情况为running
更新task队列任务执行的相关机器ip和端口信息
获取具体任务
任务步骤,比如redis集群,则会获取RedisClusterAppDeployTask的steps    
设置task步骤信息放入到数据库 准备
执行任务
如果执行任务出现异常,则将执行状态设置为中断
否则说明当前的任务执行成功

部署完成后,发送消息。

5.诊断和监控定时任务

其中我们可以看到与诊断、监控告警的代码很多,主要这方面的指标信息比较多。

诊断信息:

扫描键
键内存诊断
空闲键扫描
热点键诊断
删除键
集群槽分析
数据分析清理

相关指标:

相关指标图

com.sohu.cache.schedule.jobs.InstanceAlertValueJob监控上一分钟的数据信息:

全部和特殊实例报警配置
查询应用报警配置
所有实例信息
取上1分钟Redis实例统计信息
检测所有配置
更新配置最后检测时间
发送邮件

检测所有配置的过程:

单个实例的统计信息
判断是不是特殊实例
是否进入检测周期
枚举检测
策略检测
获取基准数据
开始检测

可以看到检测的策略:


可以看到相关指标图的信息在代码上都有体现。

这里有一个重要方法:

com.sohu.cache.alert.strategy.AlertConfigStrategy#isCompareLongRight

主要的com.sohu.cache.schedule.brevity.DispatcherBrevityScheduleJob采集统计的监控任务是job触发的BrevityScheduleType:

redis基本信息采集
 redis慢查询采集
 redis延迟事件采集
 机器信息采集
 机器监控报警任务
 机器nmon数据采集

同时可以在界面上点击页面进行检测信息提交。

6.统计信息分为三类

全局统计、server端统计、client端统计。

7.扩缩容和redis数据迁移


四、接入客户端cacheCloudClient

    可以看到官方提供了cachecloudClient项目,可以在业务系统中进行引入,此时可以愉快的使用cachecloud提供的redis的便利操作了。

cachecloudclient的相关模块:

  • cachecloud-client-redis:jedis客户端构建器;
  • cachecloud-client-redisson:redisson客户端构建器;
  • cachecloud-client-lettuce:lettuce客户端构建器;
  • cachecloud-jedis: 原生jedis封装,增加支持redis集群部署Pipeline操作的PipelineCluster,支持双机房部署的CrossRoomCluster;依赖cachecloud-client-spectator模块,对jedis命令执行进行埋点,采集命令调用次数、耗时和异常等指标进行上报;
  • cachecloud-client-spectator:jedis指标收集和上报模块,及其他工具类
目录
相关文章
|
2月前
|
NoSQL Go 网络安全
技术经验分享:codis原理及部署_01
技术经验分享:codis原理及部署_01
17 0
|
10月前
|
NoSQL 关系型数据库 MySQL
Redis私有云平台-Cachecloud安装和部署手册
Redis私有云平台-Cachecloud安装和部署手册
|
存储 SpringCloudAlibaba 监控
系统高可用番外篇:浅析sentinel源码
Sentinel 是面向分布式服务架构的流量控制组件,主要以流量为切入点,从**限流、流量整形、熔断降级、系统负载保护、热点防护**等多个维度来帮助开发者保障微服务的稳定性。
124 0
系统高可用番外篇:浅析sentinel源码
|
存储 NoSQL Linux
Redis——集群的认知 & 搭建
Redis——集群的认知 & 搭建
Redis——集群的认知 & 搭建
|
存储 NoSQL 大数据
《Redis 使用手册》:一网打尽
今天想要自来水式地推荐一本去年的新书《Redis 使用手册》。Redis 可算是现今内存数据库的实施标准,拥有丰富的数据结构和强大的功能,适用于各种不同的开发场景。对于泛化的大数据研发工程师来说,Redis 是职业生涯中绕不过去的一道坎。这本书由超过十年经验的 Redis 专家,擅长技术协作的黄健宏先生撰写,至少有以下几个特点,使得它非常适合大数据研发方向的新手。 内容详尽,循序渐进 全书一共分为三个部分总二十章。第一章仅用八页就介绍完安装 redis 和 redis-py 等准备工作,毫不拖泥带水混页数。第二章到第十章针对 Redis 开箱即用的数据结构从基础到复杂,从常用到专用一一列举
331 0
|
存储 缓存 运维
【七天玩转Redis实战营】答疑汇总Day3 Redis的运维实战
【第三讲,Redis的运维实战】 讲师:仲肥,阿里云NoSQL内核工程师;Redis Core Team member; 课程内容:Redis社区简介及运营方式介绍;云Redis的账号、监控、巡检、安全等性能介绍;审计,热点,大key等一般性解法;高级容灾。 答疑汇总:特感谢班委@邱谦 同学
【七天玩转Redis实战营】答疑汇总Day3 Redis的运维实战
|
缓存 运维 监控
【七天玩转Redis实战营】答疑汇总Day5 Redis架构及介质选择指引
【第五讲,Redis架构及介质选择指引】 讲师:民科,阿里云NoSQL内核工程师。 课程内容:如何进行Redis选型;云Redis版集群架构及对比;如何使用Redis做缓存。 答疑汇总:特感谢班委@邓小兵 同学
【七天玩转Redis实战营】答疑汇总Day5 Redis架构及介质选择指引
|
缓存 运维 监控
【七天玩转Redis实战营】答疑汇总Day2 Redis开发实操之春运迁徙页面
【第二讲,Redis开发实操之春运迁徙页面】 讲师:阿里云NoSQL内核工程师;Redis Committer,Jedis Reviewer,凡澈 课程内容:如何使用Redis:一般性Redis启动到连接;云redis从开通到连接(创建,白名单,客户端连接);使用Redis Hash,Sorted Set,Stream等结构实现一个春运迁徙页面 答疑汇总:特感谢班委@邱谦 同学
【七天玩转Redis实战营】答疑汇总Day2 Redis开发实操之春运迁徙页面
|
NoSQL 网络协议 Redis
Redis 实战篇之搭建集群
Redis 集群简介 Redis Cluster 即 Redis 集群,是 Redis 官方在 3.0 版本推出的一套分布式存储方案。完全去中心化,由多个节点组成,所有节点彼此互联。Redis 客户端可以直接连接任何一节点获取集群中的键值对,不需要中间代理,如果该节点不存在用户所指定的键值,其内部会自动把客户端重定向到键值所在的节点。
1734 0