1. 数据库自治服务(DAS)简介
数据库自治服务(Database Autonomy Service,简称DAS)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助用户消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的稳定、安全及高效。
六个核心特性:
• 72小时异常检测
• 异常信息
• 自动SQL优化
• 智能调参
• 自动弹性伸缩
• 智能压测和容量评估
1) 性能指标异常检测
性能指标异常检测是DAS在数据库运行时的状态监控功能。
• 传统方法对数据库监控是通过阈值规则设置,连续触发,无限接近,因此导致触发报警存在滞后性。
• DAS基于AI实时地进行检测,对监控指标、日志数据等进行全方位监控。
2) 特征信息
示例图:
毛刺(Spike)示例
周期性(Seasonality)示例
趋势(Trend)示例
均值偏移(Meanshift)示例
新增(Emergence)示例
3) SQL诊断与自动SQL优化
• 规模性:足具扩展性的服务架构,以支撑几十万级、百万级的大规模自动优化。
• 精准性:异常检测机制,实现优化时机的精准识别,问题SQL的精准定位。
• 安全性:线上无小事,线上变更如何做到安全可控。
• 全面性:优化效果的全面多维度跟踪,全面实时评估,也是保证安全性的要求。
• 联动性:综合治理能力,如突发的恶性慢SQL问题,DAS的自动SQL限流,自动SQL优化需要形成联动效应,实现问题的标本兼治。
4) 自动空间优化
自动空间优化手段:
• 无流量表识别
• Optimize Table
• 无流量索引识别
• 冗余索引
5) 自动SQL限流
DAS自动SQL限流是对数据库实例上特定SQL采取限制运行措施的功能,应急非常有用,可以对SQL的类型进行识别,并给出相应的建议。
可识别类型:
• 阻塞型SQL
• 资源消耗型SQL
• 流量型SQL
6) 自动弹性伸缩
• 扩容方式:增加只读节点,扩大实例规格。
• 客户感受:观测8min,变配~10min。
• 效果对比:QPS:~600->~3600;CPU:~96%->~50%。
7) 智能压测
• 低负载捕获真实业务流量。
• 支持写流量回放压测。
• 通过学习自动生成压测流量。
• 支持语法自动转换。
智能压测是主要针对SQL流水的处理,相当于记录真实SQL的行为,可以对数据库行为进行精确的评估,基于真实的业务流量来评估数据库的容量和兼容性。