文章来源:路沙 中国信息化周报
2020年11月24日,Gartner 公布 2020 年度全球数据库魔力象限评估结果,作为中国科技公司代表,阿里云首次挺进全球数据库第一阵营——领导者(LEADERS)象限,这也是中国数据库40年来首次进入全球顶级数据库行列。挺进该报告的“Leader”象限,也证明了阿里云在数据管理与分析领域的产品能力与发展策略在全球市场上已经属于第一集团军。
作为数据库领域的佼佼者,阿里云的重要研究领域,数据库自动驾驶,也同样成果显著。阿里云数据库产品专家胡航丽,在2020数据技术嘉年华上,做了前端分享和技术诠释:利用数据库自动驾驶技术,让中小企业共享阿里巴巴优势的技术资源,得到数据库的强技术支撑,保障系统高效、稳定,为用户创造更大价值。
阿里云数据库产品专家胡航丽
在数据库领域,企业应用数据库,更多侧重于业务的增长,特别是中小企业,由于数据库运维能力不足,对于数据库问题,如数据库紧急故障,定期扩容,升级,系统修复等,常常出现技术维护能力不完善所出现各种技术问题,一旦无法快速修复,业务会受到极大的影响和不可逆转的损失。
基于这点,阿里云数据库产品专家胡航丽,分享了数据库自动驾驶技术。常规企业是通过云进行部署管理数据库,云向用户提供的类似水电煤一样服务,如何基于企业自身的业务特点利用好资源,用好数据库,实现业务快速增长,对于企业来说,是存在困难和挑战的。目前有不少年营收超过1亿的企业,没有专业的数据库运维管理工程师,如遇到系统故障,业务受损的情况下,通过外援方式去解决,这种滞后的、不稳定的技术补救,会为企业带来不可估量的技术隐患。如通过阿里云数据库自动驾驶技术,即成熟和强大的数据库运维管理,7×24小时值班守护,即相当于拥有强大的DBA团队,每天每时每刻保障数据库的健康,随时出现告警,随时直接自动处理。如果靠人,可能会有工作时间的限制,以及不能7×24小时待命;另一个就是日常繁琐的问题处理,如SQL优化等,可以极大节省运维成本。
由于是平台模式,其对数据库无侵入,使得其更易于推广到其他数据库、甚至线下的数据库。同时,阿里云DAS还在技术上实现了重大创新和突破,包括首个全局综合自治引擎、首个外置式Cost-based SQL诊断引擎、基于全局Workload的优化技术、基于机器学习的实时异常发现与预测等。
这些突破性的技术使得阿里云DAS具有了业内领先的自治能力。阿里云参考自动驾驶的级别将数据库的自治能力分为5级:从全靠人的零级(Level-0)到仅仅提供基础监控、告警等信息的第1级(Level-1),到提供诊断或者优化建议但由人来决策是否使用的第2级(Level-2),到部分场景实现完全自治的3级(Level-3)以及完全自治的第4级(Level-4)。目前,阿里云DAS的自治能力已突破第3级(Level-3),也就是绝大多数工作完全不需要人参与,正在迈向最高级,即完全的自动驾驶。
“阿里云DAS覆盖的绝大部分场景基本上可以由DAS来决策。不过,用户也可以自己决定到底要开哪个特性,比如在负载增高的时候要不要主动干预,或者由DAS执行自动优化。”阿里云数据库产品专家胡航丽介绍说。
❄❄❄
据介绍,整个系统每一项功能发布前,都会先在阿里巴巴的应用场景上面验证,确认成熟后发布到阿里云上。对于数据库自动驾驶大家可能还存在的疑虑,比如自动驾驶临时出现如撞车等类似情况如何处理,DAS的整个生命周期都遵循可控、可追踪、可快速回滚的闭环设计,能快速及时处理故障,而且不对用户带来损失。
阿里云数据库自动驾驶平台,就像数据库运维领域的雷达,一天要进行几百亿次的异常检测和预测,对数据库的微小改变,都可以捕获到,是数据库运维智能的重要趋势之一。另外数据库自动驾驶的平台,是面向多引擎和多环境,除了支持阿里云外,也支持其他云厂商,除了阿里巴巴PolarDB,还支持其他自研的数据库,但基于数据库引擎本身的能力,自治能力会有区别,例如PolarDB和其他数据库综合能力相比,弹性更强,优势更明显。
基于阿里云DAS强大的自治能力,DBA可以从繁琐的日常运维工作中解脱出来,这让DBA可以将更多精力放到业务创新和发展上,发挥更大的价值。比如系统出现故障时,DAS可以帮助快速定位。更为重要的是,阿里云DAS能预先发现问题,在故障真正发生之前就解决,业务甚至是无感知的。
数据库自治服务DAS由阿里云数据库及达摩院联合研发,可提供自感知、自修复、自优化、自安全的全链路数据库管控能力,无需人工干预,让企业像体验“自动驾驶”一样使用数据库,数据库管理成本降低90%。
目前,数据库自治服务DAS已大规模应用于阿里巴巴内部业务场景,阿里巴巴集团内部85%数据库实例已实现自动驾驶,并服务了大量电商、金融、游戏等领域的企业。
【往期回顾】
进入云原生、分布式的时代 什么才是数据库的正确打开方式