开发者学堂课程【企业运维训练营之数据库原理与实践课程 :视频 -RDS常见问题排除及 DAS 自动弹性伸缩(四)】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/1201/detail/18302
视频 -RDS 常见问题排除及 DAS 自动弹性伸缩
五:本次课程回顾
今天我们的课程很多,所以再做课程内容回顾。今天我们讲云 RDS 数据库常见问题的排查和自动 DAS 弹性伸缩的介绍。在常见问题里我们主要介绍了 3 类突出问题。一种是连接类问题,连接类问题又分主要是关注在连接不上或者连接报错。这里和大家介绍了连接影响连接的一些因素。介绍了 5 个常用的命令,比如 Pinternet traceroute ,mtr 等。
遇到这种偶发的连接报错或者连接异常的情况,提醒大家要提前部署 TCB dump 的抓包命令,而且要部署成循环抓包,避免单个报文过大的情况。后续遇到这种问题就可以提前反馈我们相应的报文。也建议在报文抓包的同时,把程序的打印比如错误自治需要精确到秒级,越精确越好。第二类介绍的是只读实例复制延迟,对延迟的原因做相关分类,如何在云上 RD 输入快速的解决原始也有介绍。还有如何确认类似于大事务元数据锁无主键表。如果是确认具体相关的操作给大家做了简单介绍。第三类场景是关于 CPU IO 活跃会话突增的场景。大家以后遇到这类场景,可以首先考虑 DAS 自治服务异常检测的功能。在压测的过程中,大家看到我们异常检测是发现相关的 CPU 突增的情况,也是做相应的会话快照的信息。在这也给大家介绍DAS原理,它的优势可以根据你的活跃会话, SQL 执行情况, Mysql ,SQL 洞察做一个特征提取。也可以做一些自动 SQL 优化评估,优化效果的动作。但注意执行 DDL 添加索引的优化动作,它是在业务第一步执行。遇到需要配置DAS异常事件做事件定位,当遇到问题时,我们第一时间能够接收到通知,去做一个对应的处理。
第二部分给大家介绍自动弹性伸缩,也给大家介绍自动含义、元素与分类,给大家讲解如我们需要使用弹性伸缩时,需要在哪里配置,需要注意些什么?最后通过一个实验,带大家能够详细地了解相应的弹性伸缩的使用。
我们今天的课程就介绍到这,大家有没有什么问题。
我看到有同学提问,主备延迟或 IO 线程断开,报错1205 只能备库重搭吗?对,我们基本上都是备库重搭的。这里展开是有相应的自动的修复,自动修复比如 IO 线程或者 SQL 线程中断的就是自动化的处理的机制。当我们去检测 IO 线程和 SQL 线程中断,比如通过 stop save 不能够把相应的线程将它启动时,我们就会做自动重建的动作。
问题二是 proxy 后又会自动将子路流量均衡到子路阶上,子路几点是几点, proxy 是否可以识别到延迟,将对应的子路使命踢出?这是可以的。我之前在讲课的时候有提到,我们是可以在 proxy 上设置一个子路实例延迟的阈值。当我们的 proxy 检测到后端即某个子路节点出现延迟超过阈值的情况下,后面新增加的流量是不会达到相应的有延迟超过阈值的子路节点的问题。
三是现在 Mysql 是基于阿里内核,后期是否考虑采用物理复制,从而解决主从延迟的问题?目前来说,暂时还没有这方面的进展,后续如果有相关的动作,大家可以关注我。第一次课程介绍时,我们在 RDS 控制台注意通知,还有下方新功能发布,如果我们有相应的功能发布,这会大家一个相应的提示和通知,大家要注意这些地方。
还有同学提到磁盘弹性扩容后就不能缩容,对吗?对的,之前给大家展示首先磁盘弹性扩容是针对我们目前云盘板,而云盘板是依赖于底层的 SSD 存储,它是扩容后不支持缩容。目前支持缩容的只有本地盘 SSD,本地盘的实例,对于这种云盘类型目前还是不支持。之前有的客户可能会提出这样的一个需求,目前来说产品能力上首先是需要保证我们的数据的安全性的前提下才能去考虑支撑这样的功能。目前至少短期是还不具备云盘输入的能力。还有其他同学有相应的问题吗?
如果大家没什么问题,我们今天的课程就先到这里,后期大家在我们整个训练营的过程中,如果大家有什么问题,也欢迎大家在群里面提问,我们看到都会做相应的解答。感谢大家今天抽时间来参加我们第 4 堂课的训练营,欢迎大家在明天7 点继续参加我们第五次课程的讲解,后续也是由我们第五课也是由我们的奎星老师给大家带来,欢迎大家明天准时相见。我们今天就这,感谢各位。