这几年,云原生已成为阿里云的另一个标签,不仅最早布局云原生技术,拥有大量客户实践,更打造出丰富的云原生产品家族。尤其是数据库产品线,已进入云原生2.0阶段,通过全链路的技术支撑能力,奔向更远的星辰大海。
云原生数据库进入2.0时代
从广义概念来看,所谓云原生,是指全面使用云服务构建软件;而狭义的云原生,是指通过容器、微服务、Serverless等全新技术构建应用,它不仅影响着计算架构、开发和部署方式,更是对整个基础设施和平台能力的一种考验。
所以,数据库的云原生之路一般从IT基础设施云化、核心场景的互联网化开始。这也是阿里云智能数据库事业部总负责人 李飞飞,在多个公开场合定义的云原生数据库1.0阶段。这一阶段的典型特征是,基于云的整个IaaS能力,提升数据库本身的性能和服务体验。那么,云原生数据库2.0时代,发生了怎样的变化?有哪些新特点?阿里云数据库的云原生之路演进到何种程度了?阿里云数据库高级产品专家 蔡冬者 (花名:江柳),在DTCC大会期间接受IT168记者采访时,进行了详细解读。
阿里云数据库高级产品专家 蔡冬者 (花名:江柳)
“1.0阶段,更强调的是单品能力,比如:如何基于MySQL打造最佳业务实践;2.0阶段,用户需要的是一个能集成多种引擎的全面的数据库解决方案,尤其在移动互联网、IoT、5G技术趋势的加持下,数据的应用场景变得越来越丰富,更需要一个从生产到应用的全过程产品体系。” 蔡冬者强调,阿里云云原生数据库,已过了底层基础设施和平台云化的1.0阶段,现在正向更高服务水平进军,通过全链路的技术支撑能力,引领云原生2.0时代,把数据库服务发挥到极致。
全链路支撑能力背后的产品家族
在云原生数据库2.0理念下,阿里云在刚刚过去的云栖大会上发布了一系列产品的重磅更新版本,包括云原生关系型数据库 PolarDB 和分布式版本 PolarDB-X,云原生数据仓库 AnalyticDB,云原生多模数据库Lindorm、企业级自治数据库RDS,以及一站式在线数据管理平台DMS。关于PolarDB 、分布式版本 PolarDB-X,云原生数据仓库 AnalyticDB、云原生多模数据库Lindorm,业界关注度比较高,已有大量相关资料,这里不做过多赘述,本文主要对RDS以及与之密切相关的应用DMS做重点分析。
从大的数据库分类来看:一类是,OLTP事务型数据库;另一类是,OLAP分析型数据库,后来又衍生出HTAP混合型事务分析管理。阿里云RDS,就属于事务型数据库,也是整个云数据库市场规模最大、用户最多的一个基本业务。提到RDS,可能有人会觉得这是一款各家都有的“常规化产品”,使用体验都差不多。其实,相对同类产品,阿里云RDS具有几个重要特征。
一、拥有强大的企业级数据自治能力。阿里云RDS是基于开源以及在商业化内核基础上构建的全托管式产品形态,不仅兼容了开源数据库MySQL的内核,还做了更深度的内核优化,尤其在数据库自动驾驶层面有更卓越表现。阿里云数据库的自治能力已处于行业领先地位,不管是自治的深度、引擎支持的覆盖度,还是应用规模上,其他厂商都无法相提并论。
二、能通过内核以及相关产品的管控能力,给用户带来更快、更稳、更安全的数据库服务。为了满足互联网应用的动态负载、高并发、永不停服等业务特征,,RDS提供一体化读写分离、计算存储无缝扩展的解决方案,帮助用户动态调整读写比例或存储计算资源,解决企业在读多写少形态下的扩展性问题。为了确保高可用性,阿里云提供三副本以及两地三中心的解决方案,满足游戏、电商、运营商、金融、政府类企业对数据库的应用要求。备份恢复上,RDS可在分钟级完成TB级数据的快速恢复,解决企业业务故障情况下的快速业务回滚诉求。同时,通过深度内核优化,RDS相较于开源版本性能最高可提升80%。
三、全链路的数据安全优势,包括访问安全、存储安全、传输安全以及审计安全。
值得一提的是,阿里云认为真正的云数据库也能像生活中的水和电一样,只关心上层应用,而不需要关注底层的基础设施。阿里云于2017年首次提出“数据库自动驾驶”理念,数据库本身就具备异常自感知、自诊断、自决策、自修复、自弹性及自安全的能力,完全自闭环解决企业数据库遇到的性能、可用性以及数据可靠性等问题。以阿里巴巴集团为例,已为所有数据库开启自动驾驶能力,同时,6000家企业客户也已通过RDS实现数据库的自动驾驶。
在企业级数据库自动驾驶能力方面,阿里云在数据库智能调参ResTune系统论文被SIGMOD2021录用,这是阿里云自治数据库和智能化运维取得的里程碑式的一步。所谓的智能调参,是指结合了机器学习以及大量专家经验和逻辑,去做对数据库影响比较大的参数优化,从根本上帮助企业降低参数调优门槛,满足千行百业的工作负载需求。
阿里云除了拥有强大的数据库自治能力,还有另外一款明星产品,即一站式数据管理平台DMS。DMS并不是一个从无到有、从0开始构建的产品,它最早在阿里巴巴集团内部孵化,主要解决数据库开发效率问题。之后,随着企业业务的发展,用户也越来越关注海量数据的采集、集成及价值挖掘,此时,用户开始涌现出对数据处理、加工、分析以及应用集成等一系列需求,这需要企业要拥有更强大的平台管理能力。于是,阿里云在2021年对DMS进行了一站式升级。
阿里云DMS包括几个重要模块,包括:数据库的开发设计模块(最早开发的模块);数据集成模块(主要解决跨数据源之间的数据流动问题);数据开发加工模块;数据库的应用模块,以及横跨这些模块的数据安全及DevOps等,基本上所有的数据生产和管理能力都可以在这个平台上解决。
基于DMS,企业可以真正实现库仓一体,可以让数据流动变得简单,而且能做到实时的数据流动和集成。另外,DMS内置了强大的数据安全能力,可以让用户从生产到应用层面拥有一站式的安全能力,包括可以自定义符合规则的安全引擎,对敏感数据进行脱敏,设置安全访问拦截功能等。同时,平台本身可以提供端到端的自助诊断能力,能帮助用户快速发现、诊断数据在流动、集成以及流转过程当中遇到的所有问题。DMS的一站式体验,还体现在覆盖的数据源比较多,有27种常见数据源,所有数据都能实现统一管理。
所以,整体来看,阿里云云原生数据库产品家族,不仅强调全场景、全链路支撑能力,单品云原生能力也在持续演进,尤其从RDS以及DMS表现来看,正在向智能化以及安全可靠性方面升级。
融合趋势的根本是解决业务多样化需求
除了更强调智能化和安全性,其实融合型趋势也是云原生2.0时代的一种新变化。
蔡冬者认为,不管是湖仓一体化、大数据一体化,还是多模,本质上是企业数据的多样性导致计算的多样性需求起来了。这时,数据库的发展会表现出几种演进思路。一个是专项专用,即每个引擎只解决我独特的场景问题,通过复杂的技术形态组合来解决企业的多样化需求,这是一种解决思路。第二种思路,是通过一体化融合的趋势,降低企业解决问题的成本。比如:通过多样化的计算存储需求,降低数据计算存储的成本及门槛。
而云原生+分布式的结合,主要是解决目标客户群体的高并发、持续运营、动态负载及海量数据等问题。当传统的单机数据库遇到容量瓶颈,云原生+分布式演进方向显然是最佳选择,可以帮助用户满足互联网业务形态下的挑战。同样,软、硬件一体化,也是IT技术发展的必经阶段,通过更深层次的软硬件结合,可以从设计之初提升应用本身的性能、稳定性和安全性等问题。
不管是哪种融合模式,阿里云数据库会始终秉承云原生2.0目标,在底层的引擎布局上,布局全链路能力。其中,智能化、安全可控、在线一体化、多模以及与分布式结合的方向,都是单品能力继续精进的主攻方向。包括在国产化替代大背景下,会对数据库的安全要求越来越高,阿里云推出全加密数据库产品,确保政府、金融以及运营商行业用户,拥有更强的数据加密能力。针对去O趋势,阿里云数据库也在做相关准备,推出了一整套数据库升级迭代解决方案,包含PolarDB -O,可以实现金融级的数据库迁移。
阿里云数据库拥有丰富的业务场景,不仅单一数据库产品能力强,更拥有全场景化的服务能力。经过多年的技术打磨和云原生化的快速迭代,阿里云数据库产品在易用性、性价比以及稳定性方面,都拥有更卓越表现,这可能是用户选择阿里云数据库的最根本原因。换言之,产品本身的内核以及强大的技术研发能力,是阿里云数据库取得用户信任、建立庞大用户生态的基石。
点击查看一站式在线数据管理平台DMS更多信息