2020年4月,阿里云数据库自治服务DAS 正式发布,开启数据库“自动驾驶”新时代。经过一年的时间,数据库自治服务DAS的辅助自治模式已经支持阿里云全网100%的高可用实例,并且已经有超过5000的客户,运行在DAS的自治模式,即授权DAS进行数据库的自修复、自优化、自运维和自安全。
让数据库发挥最优的效能,依赖很多数据库专业领域知识,对于大部分企业和应用开发者而言,依然充满挑战,如故障诊断,快速定位根因并进行有效的止损;业务快速迭代过程中的数据库的持续调优、SQL Review等,都是非常耗时耗力且需要7x24小时值守的能力,因此,数据库走向自治是一个必然趋势。
如果说,传统数据库向云数据库的转变是“汽车换马车”,那么DAS就是给“汽车”加上了“自动驾驶”的引擎,拥有了“自动驾驶”的能力。
在今天的发布会上,针对用户的核心痛点,DAS新发布了8大核心自治功能,包括7x24小时异常检测、自动SQL限流、自动SQL优化、自动空间优化、自动弹性伸缩、智能调参、智能压测、实时审计等,为企业的SQL问题、数据库负载问题、空间问题、容量评估、安全审计,从异常发现、根因定位、自修复/自优化/自安全,既能实现快速止损,又会持续不断的对数据库进行优化,无需人工干预,让企业像体验“自动驾驶”一样使用数据库,数据库管理成本降低90%。
SQL问题——以无人值守方式,实现数据库持续优化
数据库性能问题70%以上是SQL问题,但是传统方案下面缺乏有效的止损手段,并且不具备提前预防、持续优化的可能性。
DAS通过异常SQL的定位、异常SQL自动限流、自动SQL优化、结果验证,覆盖解决SQL问题的各个环节,实现及时发现、快速止损、持续优化和可验证。
数据库负载问题——实现全链路自动弹性伸缩,应对业务负载变化
对于绝大多数企业来说,数据库都是主干系统,数据库负载飙升,会对业务造成巨大的损失,但是基于阈值的告警方式,存在异常发现延迟大的问题,往往不能在负载发生变化的时候,快速发现并及时采用止损措施。
DAS的7x24小时异常检测,可以1分钟内检测到数据库异常,并且支持全链路自动弹性伸缩(包括带宽、Porxy、CPU/内存/IO、节点等等),能够快速解决数据库负载问题,保障业务持续可用。
空间问题——数据库空间问题的自修复、自优化
数据库空间问题,影响着数据库的性能和成本,DAS针对数据库常见的空间问题,提供了完整的“治标”+“治本”的自修复、自优化方案,节省数据库使用成本的同时,提升数据库的性能。
DAS全方位自治能力 助力企业用户发挥数据库最优效能
随着数据时代的来临,各个企业在业务高速增长的过程中都会不可避免地遇到数据库种类繁多、数据监测困难、运维成本高昂等常见数据库运维痛点。过去一年中,DAS已与5000+企业建立合作,为其提供专业且高效的数据库管理服务。我们以知名 “AI+教育”上市公司英语流利说和知名企业服务提供商用友用友为例,为大家展示DAS作为数据库性能优化利器,如何破解用户性能痛点,降低运维成本。
流利说:流利说基于DAS构建了数据库运维体系和工具。该体系针对全局workload,采用真实的业务流量和场景持续优化,完成自动跟踪和回滚的流程闭环,实现自动SQL Review和自动优化,让数据库完成真正的”自治“。在操作流程上,DAS的标准化无感接入和监控流程,有效规避作业过程中人为遗漏及误操作的可能性。
整套数据库运维体系因DAS统一接入和管理、自动诊断、自动SQL Review和优化等特色,真正做到专业且高效,大大减轻了流利说DBA日常工作量。
流利说基础架构负责人孙文杰表示:“DAS的引入使流利说数据库整体性能得到优化,运维人效大幅提升,并帮助数据库管理团队从繁重的日常工作中释放人力,实现团队转型升级。DAS帮流利说更聪明、更专业、更高效地使用数据库服务。”
用友:DAS轻量级、个性化的智能压测服务,帮助用友营销云使用真实业务场景和流量评估MySQL数据库迁移到PolarDB的数据库容量和兼容性。
在此过程中,DAS低负载捕获真实业务流量、通过学习自动生成压测流量、支持写流量回放压测和语法自动转换,都有助于各项评估预见到可能存在的风险,多维度、高视角、全方位地为数据库迁移保驾护航。
容量评估方面,更是在智能压测期间根据业务需求精准评估了PolarDB规格,规避了潜在的性能风险,精准评估迁移实例规格,避免了不必要的IT资源浪费。
整个过程中,DAS一直为用友的数据库迁移保驾护航,提前发现兼容性、性能风险,完成合理的容量评估。最终,顺利完成数据库迁移的业务规划。
DAS诚挚邀你进入数据库“自动驾驶”时代
仅仅用时一年,DAS便获得了5000+客户的信任,迈入数据库“自动驾驶”时代。除去时代的需求,这份成功背后还有一些必然因素。
阿里巴巴内部纷繁复杂的业务场景、超过10万的数据库实例、快速迭代的业务、超级热点“双十一”等等,都给DAS提供了独一无二、不可替代的“自动驾驶”训练场,帮助DAS锤炼自动驾驶的能力。虽然DAS在2020年才发布,但其实早在2017年就开始研发了。在阿里巴巴内部,DAS经历了3年不间断的锤炼,支撑了3个双十一,自动优化了超过4900w的慢SQL,自动回收了4.6 PB的空间,自动优化了12%的内存。
此外,达摩院前沿研究的转化,用户业务类型的多样性、数据库的复杂性等等,都给数据库的自动驾驶带来了巨大的挑战,其中很多问题对于专业的DBA都是难题,而DAS选择了迎难而上,走在时代前面,预先解决一切问题。DAS由阿里云和达摩院联合研发,在异常检测、SQL诊断、根因定位等等核心技术上面获得了巨大的突破。过去3年,DAS相关研发团队在数据库国际顶级会议发表了4篇论文,包括SIGMOD、VLDB大会等。
在过去半年多的时间里,DAS每天进行数千亿次的异常检测,进行至少20万次以上的SQL诊断和优化,累计已帮助用户自动处理10000+的故障,实现1分钟发现、5分钟定位、10分钟止损,无需用户人工干预,最大限度地保障数据库持续可用的阶段性目标。未来必将是数据库全自治的时代,DAS也将持续以数据库自动驾驶为目标,不断为其增加自感知、自决策、自恢复、自优化和自安全的自治能力,为用户和行业解决更深层次的需求。
相关阅读:
深度技术揭秘 | 大促狂欢背后,如何有效评估并规划数据库计算资源?
重磅 | 数据库自治服务DAS论文入选全球顶会SIGMOD,领航“数据库自动驾驶”新时代
干货|SQL请求行为识别新功能上线,帮助解决异常SQL检测之大海捞针问题
功能更新|DAS推出全局Workload优化功能,实现SQL自动诊断
干货|一文读懂阿里云数据库Autoscaling是如何工作的