CacheCloud学习

本文涉及的产品
云数据库 Tair(兼容Redis),内存型 2GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
简介: CacheCloud作为一款可视化方便管理redis的开源软件,可以方便redis集群的管理、开发、监控、运维管理,下面就CacheCloud的代码进行一些整理和学习

一、如何实现可视化工具方便redis操作管理

如果基于redis,如何设计一款工具,方便redis安装、使用、运维、告警、迁移的问题?需要从下面几个方面进行考虑:


1.方便申请
2.方便安装
3.方便使用
4.进行告警
5.自动运维
6.方便数据迁移
7.弹性伸缩

也即需要实现上面的这些功能。


二、开源项目CacheCloud

基于上面的这些功能:搜狐开源的CacheCloud实现了上面的这些功能:

官方的功能架构图

CacheCloud功能架构

根据提供的功能,它分为两部分:

服务端CacheCloud:方便运维、申请、告警、数据迁移、扩缩容

客户端cachecloud-client:方便业务系统调用使用,同时对redis的相关api进行了封装和jedis数据指标上报。

CacheCloud界面

分为后台管理、我的工单、应用列表

1)后台管理:


2)我的工单:

申请工单前需要在后台管理的用户管理里面添加好用户信息。


3)应用列表:


用户可以创建工单,工单中包含的功能:申请应用、导入应用、数据清理、下线应用、数据迁移、诊断应用、键值分析(bigkey的问题等)、扩缩容、修改应用配置、修改报警、数据分析清理等。


三、相关操作过程

1.启动项目

我们可以看到有四个定时任务执行比较频繁:

taskExecuteJob
InstanceAlertValueJob
BrevitySchedulerJob
DispatcherBrevityScheduleJob

其中

TaskExecuteJob是执行taskQueue中的任务
InstanceAlertValueJob是监控所有Redis上一分钟状态
BrevitySchedulerJob则维护全量定时任务逻辑,维护节点和机器
DispatcherBrevityScheduleJob 获取短频任务bean,然后执行定时任务转发,
                             其核心实现asyncSubTaskIds,执行相关数据的采集上报和统计

其中我们可以看到与诊断、监控告警的代码很多,主要这方面的指标信息比较多。可以从数据库看到定时任务执行的频率:

从这里可以看到相关task执行的频率:


2.执行工单申请

我们可以在我的申请中,申请一个redis应用的工单


3.执行工单审批

工单申请后,会在后台管理的审批列表中,看到对应的审批信息:


后台用户审批通过后,即可进行部署:

审批的过程中,会生成部署预览,生成成功后,即可进行部署,如果当前的申请不满足条件,则可以进行驳回。此时会调用doAddAppDeployTask执行部署。部署的过程:

1.保存应用信息
2.获取Redis版本信息
3.根据应用类型获取部署拓扑信息,部署对应的task,此时会根据task类型会先获取应用信息,
  然后生成并保存taskqueue,新增审批信息审核记录

其中部署对应的task类型:

redis cluster
sentinel + redis
standalone
twemproxy + redis
sentinel + pika
twemproxy + pika

此时定时任务task已经保存到了数据库表task_queue表中,因此只需要执行task即可。而触发task_queue中task执行的则是taskExecuteJob。从数据库中可以看到taskExecuteJob的执行频率是非常频繁的,每10秒钟会触发一下。

4.taskExecuteJob执行taskQueue触发

在com.sohu.cache.task.impl.TaskServiceImpl#executeTask这个方法,我们可以看到具体任务的执行情况。执行的过程如下:

获取具体的队列task,进行判空和状态
更新task队列任务执行的情况为running
更新task队列任务执行的相关机器ip和端口信息
获取具体任务
任务步骤,比如redis集群,则会获取RedisClusterAppDeployTask的steps    
设置task步骤信息放入到数据库 准备
执行任务
如果执行任务出现异常,则将执行状态设置为中断
否则说明当前的任务执行成功

部署完成后,发送消息。

5.诊断和监控定时任务

其中我们可以看到与诊断、监控告警的代码很多,主要这方面的指标信息比较多。

诊断信息:

扫描键
键内存诊断
空闲键扫描
热点键诊断
删除键
集群槽分析
数据分析清理

相关指标:

相关指标图

com.sohu.cache.schedule.jobs.InstanceAlertValueJob监控上一分钟的数据信息:

全部和特殊实例报警配置
查询应用报警配置
所有实例信息
取上1分钟Redis实例统计信息
检测所有配置
更新配置最后检测时间
发送邮件

检测所有配置的过程:

单个实例的统计信息
判断是不是特殊实例
是否进入检测周期
枚举检测
策略检测
获取基准数据
开始检测

可以看到检测的策略:


可以看到相关指标图的信息在代码上都有体现。

这里有一个重要方法:

com.sohu.cache.alert.strategy.AlertConfigStrategy#isCompareLongRight

主要的com.sohu.cache.schedule.brevity.DispatcherBrevityScheduleJob采集统计的监控任务是job触发的BrevityScheduleType:

redis基本信息采集
 redis慢查询采集
 redis延迟事件采集
 机器信息采集
 机器监控报警任务
 机器nmon数据采集

同时可以在界面上点击页面进行检测信息提交。

6.统计信息分为三类

全局统计、server端统计、client端统计。

7.扩缩容和redis数据迁移


四、接入客户端cacheCloudClient

    可以看到官方提供了cachecloudClient项目,可以在业务系统中进行引入,此时可以愉快的使用cachecloud提供的redis的便利操作了。

cachecloudclient的相关模块:

  • cachecloud-client-redis:jedis客户端构建器;
  • cachecloud-client-redisson:redisson客户端构建器;
  • cachecloud-client-lettuce:lettuce客户端构建器;
  • cachecloud-jedis: 原生jedis封装,增加支持redis集群部署Pipeline操作的PipelineCluster,支持双机房部署的CrossRoomCluster;依赖cachecloud-client-spectator模块,对jedis命令执行进行埋点,采集命令调用次数、耗时和异常等指标进行上报;
  • cachecloud-client-spectator:jedis指标收集和上报模块,及其他工具类
目录
相关文章
|
运维 Kubernetes 监控
揭秘高效运维:如何用kubectl top命令实时监控K8s资源使用情况?
揭秘高效运维:如何用kubectl top命令实时监控K8s资源使用情况?
3865 0
|
SQL 监控 算法
MySQL高可用 MGR8.0 最佳实践——张彦东
MySQL高可用 MGR8.0 最佳实践——张彦东
4672 38
MySQL高可用 MGR8.0 最佳实践——张彦东
|
JSON NoSQL Redis
redis-full-check校验工具
redis-full-check是阿里云Redis&MongoDB团队开源的用于校验2个redis数据是否一致的工具,通常用于redis数据迁移后正确性的校验。
24712 0
|
NoSQL Redis 数据库
深入理解redis cluster的failover机制
社区版redis cluster是无中心节点P2P的集群架构,内部采用gossip协议传递维护集群的拓扑结构和集群元数据。社区文档地址:https://redis.io/topics/cluster-tutorial failover是redis cluster提供的容错机制,cluster最核心的功能之一。
13706 0
|
2月前
|
应用服务中间件 Linux 网络安全
使用Nginx免费版与Keepalived实现高可用性High Availablity方案
本文介绍了如何使用Nginx免费版与Keepalived实现高可用性(HA)方案,涵盖环境搭建、Keepalived安装配置、版本升级及主从模式设置。通过虚拟机测试,结合CentOS与宝塔,详细说明VIP配置与服务启动流程,助你构建稳定可靠的Web高可用架构。
|
NoSQL 关系型数据库 MySQL
Redis私有云平台-Cachecloud安装和部署手册
Redis私有云平台-Cachecloud安装和部署手册
|
自然语言处理 Docker 容器
elasticsearch-analysis-ik分词器下载与安装
elasticsearch-analysis-ik分词器下载与安装
3585 0
elasticsearch-analysis-ik分词器下载与安装
|
7月前
|
SQL JSON 数据可视化
基于 DIFY 的自动化数据分析实战
本文介绍如何使用DIFY搭建数据分析自动化流程,实现从输入需求到查询数据库、LLM分析再到可视化输出的全流程。基于经典的employees数据集和DIFY云端环境,通过LLM-SQL解析、SQL执行、LLM数据分析及ECharts可视化等模块,高效完成数据分析任务。此方案适用于人力资源分析、薪酬管理等数据密集型业务,显著提升效率并降低成本。
11347 16
|
7月前
|
Cloud Native Java Nacos
springcloud/springboot集成NACOS 做注册和配置中心以及nacos源码分析
通过本文,我们详细介绍了如何在 Spring Cloud 和 Spring Boot 中集成 Nacos 进行服务注册和配置管理,并对 Nacos 的源码进行了初步分析。Nacos 作为一个强大的服务注册和配置管理平台,为微服务架构提供
2527 14
|
SQL 关系型数据库 MySQL
(二十五)MySQL主从实践篇:超详细版读写分离、双主热备架构搭建教学
在上篇《主从原理篇》中,基本上把主从复制原理、主从架构模式、数据同步方式、复制技术优化.....等各类细枝末节讲清楚了,本章则准备真正对聊到的几种主从模式落地实践,但实践的内容通常比较枯燥乏味,因为就是调整各种配置、设置各种参数等步骤。
1181 3