阿里云李飞飞:中国数据库的时与势

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 Tair(兼容Redis),内存型 2GB
简介: 数据库、操作系统和中间件并列为三大基础软件,无论是在银行存取款,还是进行健康码查询,我们的日常应用和企业业务背后都离不开数据库。可以说,没有数据库,就难以构建数字化底座。过去的40多年,数据库技术一直在创新与迭代,经历了不亚于移动通信技术从1G到5G的巨大跨越。云计算的出现,让全球数据库市场格局迎来了40年以来的最大拐点。而这一次,时与势站在中国厂商一边。

image.png

作者简介:

李飞飞,阿里巴巴集团副总裁,阿里云数据库产品事业部负责人、达摩院首席数据库科学家。IEEE FellowACM杰出科学家

 

 

决定冰山高度的,是水面之下你看不见的80%

 

如果我们将企业业务比作一座冰山,将数据比作数字时代的新石油,那么数据就是埋藏在水面之下的庞大基底,其蕴藏的动力潜能令人期待。如何帮助千行百业的用户存好、用好、管好数据,为企业数字化转型赋能,需要承载数据的主体、核心基础软件——数据库作为坚实底座。

 

数据库、操作系统和中间件并列为三大基础软件,企业业务和日常应用都离不开数据库。无论是在银行存取款,还是进行健康码查询,背后都离不开数据库。可以说,没有数据库,就难以构建数字化底座。

 

在国际权威机构Gartner刚刚公布的2021年全球云数据库魔力象限评估结果中,作为中国科技公司代表,阿里云数据库蝉联了领导者LEADERS)象限,意味着阿里云数据库综合实力已稳居全球第一阵营。

 

这既是对阿里云数据库实力的肯定,同时也证明了阿里云围绕云原生数据库新赛道进行前瞻布局和自研创新的战略是正确的。2020年,阿里云首次挺进全球云数据库领导者象限,是中国数据库40年来第一次进入全球顶级数据库行列。今年,阿里云仍是唯一进入领导者象限的中国企业,能够在国际舞台上为中国数据库赢得认可,我感到非常自豪。


今年入选Gartner全球云数据库魔力象限的企业共有20家,中国2家,占比10%。这与中国巨大的市场空间和产业应用前景并不相称。在我看来,未来一定会有更多中国厂商出现在这份榜单上,并且不断向着领导者象限迈进。


我之所以有这样的判断,是因为云计算的出现,让全球数据库市场格局迎来了40年以来的最大拐点。而这一次,时与势会站在中国厂商一边。

数据库的40年大变局


数据库是数字经济里最重要的基石,人们已切身感受到移动通信、智能手机、AI所带来的日新月异的变化,但数据库似乎变化不大。不过在数据库从业者眼里,在过去的40多年,数据库技术一直在持续创新与迭代,经历了不亚于移动通信技术从1G5G的巨大跨越。


上世纪80年代初,数据库系统逐步走进信息技术舞台的中央。2000年前后,大数据技术兴起;再到2010年后,云计算热度持续升温,云原生、分布式等技术的不断发展。展望未来,数据库技术会因为云计算实现技术上的极大跃迁。


随着企业业务全面向数字化、在线化、智能化演进,企业面临呈指数级递增的海量存储需求和挑战,包括并不限于诸如业务热点和突发流量带来的挑战。企业不仅需要降本增效,还需要进行数据分析、数据洞察,从而产生可指导行动的智能决策,传统的商业数据库已经难以满足和响应快速增长的业务诉求:

 

一:系统面临持续扩容的挑战。传统数据库是在冯·诺依曼架构下发展而来,其核心特征是计算、存储等资源的紧耦合。当业务需要的资源超过底层系统所能提供的容量后,需要对现有系统进行灵活弹性的扩容。

 

二:系统永远会存在宕机的风险。如果支撑核心在线业务的数据库出了问题,将导致业务系统无法正常运行。数据库需要高可用,确保无论底层资源发生任何问题,数据库都可以实现不同服务器、不同虚拟机、甚至是不同可用区和地域之间的切换,保证上层业务系统对底层硬件资源的错误或者风险的无感知容错。

 

面对这两个核心挑战,云原生数据库利用虚拟化技术将计算、存储等资源进行池化,将存储计算分离。打个比方,以前创建独立的数据库,好比每家每户各打一口水井。如今的云原生数据库,则是把这些水井底部的水资源连接起来,表面上还是一口口独立的水井,但是水井的底部已经连在一起,形成了一个隐形的池塘,能实现随时按需用水。

 

概而言之,从传统数据库到云原生数据库,最大的技术变革是资源池化与资源解耦,以及由此而带来的弹性、高可用、容器化部署、智能化运维等为核心能力。这背后是技术的不断解耦,是技术的解构与重组。通过在技术上把存储计算池化并且分离,为各企业提供不间断、弹性扩展、高可用的数据库服务。

 

 

云计算的本质,是利用分布式和虚拟化技术将资源高效池化,而对应用进行透明的集中式部署。业界目前主流的发展趋势,是将资源池化、资源解耦,以云原生、分布式的技术为基础。阿里云所打造的云原生数据库2.0 —— 一站式全链路数据管理与服务,将云原生技术和分布式技术合二为一:上层是分布式,下层以云原生的方式实现,每个分区都可以享受云原生带来弹性、高可用的能力,同时上面有分布式带来的水平拓展的能力,解决高并发可能带来的瓶颈问题。在这个基础上,打造面向不同应用场景和需求的专属数据库和数据仓库系统,做到专库专用;同时,利用HTAP、在离线一体化、库仓一体、多模数据处理等核心技术,实现数据处理与分析的融合,以及数据在不同应用场景和系统之间的自由流转。最后,通过在线数据管理平台来实现一站式全链路数据管理与服务。


举例来说,在传统架构下,企业部署一套IT系统,就需要部署一个数据库,并且要按照可预知的业务峰值来规划设计系统容量和冗余,进行安装部署。这一模式带来的问题和挑战,是高成本和低使用率,因为大部分时间系统是闲置的、资源是错配的。云原生数据库的资源解耦很好地解决了这个问题。

 

去年,我们为钉钉快速扩容了10万多台云服务器的软硬件资源,但是数据库系统并不需要像传统数据库那样进行复杂且耗时的扩容部署,而是通过云原生技术,采用层级分离、弹性解耦的方式满足业务需要。在云原生数据库系统中,我们可以通过AI和机器学习技术实现智能自动化的运维过程,快速调动资源,匹配业务需求,需要多少资源就扩展多少资源。就像自来水系统,用户可对水量进行实时灵活的控制。如果需求上升,就开大水龙头,需求下降就调小水龙头。业务峰值过后,可以快速释放资源,大幅提升系统资源使用效率。反过来对业务系统来讲,运维简易化程度和效率也大大提升。

 

11是全球最大的超级数字工程之一,是阿里巴巴技术的练兵场,但阿里云数据库经受住了最严苛的检验。如2020年双11零点的峰值58万笔/秒,每一笔交易还会有一个拆单的动作,到数据库系统就是每秒几百万TPS(Transactions Per Second,每秒处理事务数)。这种瞬间爆发的场景,如果不是利用云原生的技术,简单依赖传统技术根本无法满足这种高并发、弹性、高可用的要求。


2021年是数字化转型的普及年,千行百业的业务加速上云进程。即使是单一客户,也拥有多样化的复杂业务以及丰富的业务负载特性,单一产品和架构已很难满足客户需要。阿里云数据库全面拥抱云原生,首次从客户场景视角,提出了一站式全链路数据管理与服务的理念,希望通过产品及产品组合,满足企业多样化的业务诉求。

 

面向云原生数据库2.0时代,阿里云数据库提供了涵盖数据生产和集成(DTSDMSDBS)、数据实时处理与存储(RDSPolarDB产品系列、LindormTair)、数据分析和发现(AnalyticDB产品系列)、数据开发、管理和智能运维(DMSDAS)的一站式全链路、全生命周期、全场景的数据管理与服务,通过触手可及、简单易用、安全可靠的云数据库,让数据无缝的自由流动。


中国数据库厂商的时与势


数据库作为应用型技术,先发优势和生态建设非常重要,如果没有技术上的突破性创新,后来者想要超越,可能性很小。在云时代的滚滚洪流之下,云计算已成为数据库发展的新赛道,中国数据库企业迎来了绝佳的变革机遇期。


Gartner预测,到2022年,云数据库管理系统(DBMS)的收入将占DBMS市场总收入的50%,比2020年预测的提前了一年。数据库继续向云迈进,全球数据库产业结构正在加速重构。


云计算作为一种全新的科技服务,对数据库的研发、使用、销售等方方面面带来了彻底的变革,也让全球厂商在数据库赛道上站在了同一起跑线上。中国有着众多的数字用户,有很多独特业务场景。没有成功应对双11流量洪峰、健康码等场景的数据库厂商,很难知道如何解决海量数据、超高并发交易洪峰等实际业务问题。放眼全球,中国厂商独享这样的机会。这一次,中国厂商乘而上,拥有了比肩国外数据库的技术和创新能力。

 

以阿里云自研云原生数据库PolarDB为例,2017年才启动自主研发,但到今天很多功能,如内存、计算与存储三层解耦架构实现秒级弹性、多主多写、基于内存池化的列存索引支持HTAP等已经是全球首创或业内领先的技术,创新步伐已经领先国外同行。


中国信息通信研究院今年6月发布的《数据库发展研究报告(2021年)》指出,我国数据库产业进入重大发展机遇期。报告显示,2020年,中国数据库市场规模约为241亿元,全球市场占比约5.2%。预计到2025年,中国数据库市场总规模将达到688亿元,市场年复合增长率(CAGR)为23.4%,全球占比12.3%左右。


数字经济的蓬勃发展,必然推动了中国数据库市场的快速增长。中国的数据库行业能够挺进并蝉联Gartner魔力象限的领导者地位,是几代人不懈努力的结果。数据库行业取得今天的成绩,与国家对基础软件产品的扶持、以及政策的引导和加持是分不开的。

 

如果说,过去中国数据库技术打不开市场,有很多客观原因,但是今天中国乃至海外的企业,已经开始大规模接受中国数据库技术,并且金融、政务等核心应用开始尝试用云数据库大规模替代传统数据库。随着科技自立自强的重大战略实施,这种全面替代会是一个确定的趋势,会有越来越多的企业使用中国数据库技术。云原生与分布式一体化、在离线一体化、HTAP混合负载查询与处理、物联网及多模数据融合处理与分析、安全可信与隐私保护、智能化运维与调优、机器学习和AI负载以及智能化算子与应用支持、新型硬件的适配和优化将成为云原生数据库重点发力和突破的技术方向。

 

今天,中国提供数据库产品的厂商已超过80家,其中很多企业受到资本的高度关注和追捧,成为新锐的独角兽厂商。虽然国内数据库企业单一厂商的人员规模还不足以与全球巨头企业抗衡,但是产业人才已经形成了一定的规模和梯队。这为中国数据库产业的稳步发展打下了坚实的人才基础。阿里云数据库也致力于培养数据库领域的技术人才,建立开源云原生分布式数据库社区与组织,撰写云原生数据库教材,希望吸引更多人参与、学习、贡献数据库技术,实现人才生态的繁荣。

 

此外,通过产学研合作的携手创新,在数据库领域VLDBSIGMODICDE三大顶会的论文中,中国厂商的论文数量也呈现了逐年上升趋势,近几年的贡献占比保持在23%左右,部分论文提出的数据库技术创新甚至获得全球同行的认可。这也是中国数据库企业趁势而起的标志之一。


因天之时,就地之势,依人之利,则所向者无敌,所击者万全矣。在这样的产业大变革时代,深刻认识和正确把握我们所面临的时与势,有利于中国数据库厂商看清方向,找到快速成长的路径。我相信,时与势也必定转化为中国数据库产业快速发展的动力,让我们在这样关键的信息技术领域拥有应有的一席之地。


相关阅读:

Gartner魔力象限专题点击了解报告详情

重磅 | 阿里云连续两年入选Gartner®数据库领导者象限


相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
12天前
|
缓存 弹性计算 NoSQL
新一期陪跑班开课啦!阿里云专家手把手带你体验高并发下利用云数据库缓存实现极速响应
新一期陪跑班开课啦!阿里云专家手把手带你体验高并发下利用云数据库缓存实现极速响应
|
12天前
|
安全 NoSQL 关系型数据库
阿里云数据库:助力企业数字化转型的强大引擎
阿里云数据库:助力企业数字化转型的强大引擎
|
13天前
|
存储 NoSQL MongoDB
基于阿里云数据库MongoDB版,微财数科“又快又稳”服务超7000万客户
选择MongoDB主要基于其灵活的数据模型、高性能、高可用性、可扩展性、安全性和强大的分析能力。
|
15天前
|
人工智能 Cloud Native 关系型数据库
阿里云关系型数据库连续五年蝉联榜首
全球领先的IT市场研究和咨询公司IDC发布了《2023年下半年中国关系型数据库软件市场跟踪报告》,2023年阿里云整体市场份额(公有云+本地部署模式)稳居第一,其中公有云市场份额高达39.2%,自2019年起连续5年蝉联榜首。
|
16天前
|
安全 NoSQL 关系型数据库
阿里云数据库:构建高性能与安全的数据管理系统
在企业数字化转型过程中,数据库是支撑企业业务运转的核心。随着数据量的急剧增长和数据处理需求的不断增加,企业需要一个既能提供高性能又能保障数据安全的数据库解决方案。阿里云数据库产品为企业提供了一站式的数据管理服务,涵盖关系型、非关系型、内存数据库等多种类型,帮助企业构建高效的数据基础设施。
34 2
|
23天前
|
存储 分布式计算 数据库
阿里云国际版设置数据库云分析工作负载的 ClickHouse 版
阿里云国际版设置数据库云分析工作负载的 ClickHouse 版
|
13天前
|
存储 NoSQL MongoDB
小川科技携手阿里云数据库MongoDB:数据赋能企业构建年轻娱乐生态
基于MongoDB灵活模式的特性,小川实现了功能的快速迭代和上线,而数据库侧无需任何更改
|
13天前
|
运维 NoSQL BI
简道云搭载阿里云MongoDB数据库,帮助数以万计企业重构业务系统
通过与MongoDB和阿里云团队的合作,让简道云少走了弯路,保障了线上服务的长期稳定运行,提高了吞吐效率,并相应降低了线上运行成本
|
15天前
|
NoSQL 数据管理 关系型数据库
利用阿里云的尖端数据库解决方案增强游戏数据管理
利用阿里云的尖端数据库解决方案增强游戏数据管理
|
2月前
|
存储 监控 数据挖掘
飞轮科技携手观测云亮相云栖大会,全方位展示阿里云数据库 SelectDB 版核心优势
飞轮科技技术副总裁姜国强于「数据分析与洞察」专场分享[阿里云数据库 SelectDB 版在日志存储分析、实时报表生成、用户行为分析及 Lakehouse 场景应用方案
飞轮科技携手观测云亮相云栖大会,全方位展示阿里云数据库 SelectDB 版核心优势

热门文章

最新文章

  • 1
    非阻塞 I/O:异步编程提升 Python 应用速度
    8
  • 2
    2024 Mysql基础与进阶操作系列之MySQL触发器详解(20)作者——LJS[你个小黑子这都还学不会嘛?你是真爱粉嘛?真是的 ~;以后请别侮辱我家鸽鸽]
    5
  • 3
    2024 RedisAnd Mysql基础与进阶操作系列(16-1)作者——LJS[你个小黑子这都还学不会嘛?你是真爱粉嘛?真是的 ~;以后请别侮辱我家鸽鸽]
    4
  • 4
    2024Mysql And Redis基础与进阶操作系列(13)作者——LJS[你个小黑子这都还学不会嘛?你是真爱粉嘛?真是的 ~;以后请别侮辱我家鸽鸽]
    6
  • 5
    2024Mysql And Redis基础与进阶操作系列(10)作者——LJS[你个IKUN还学不会嘛?你是真爱粉嘛?真是的 ~;以后别侮辱我家鸽鸽]
    5
  • 6
    2024 RedisAnd Mysql基础与进阶操作系列(15)作者——LJS[你个小黑子这都还学不会嘛?你是真爱粉嘛?真是的 ~;以后请别侮辱我家鸽鸽]
    4
  • 7
    2024Mysql And Redis基础与进阶操作系列(9)作者——LJS[含MySQL存储过程之局部、系统变量、参数传递、流程控制-判断/case具体详步骤;注意点及常见报错问题所对应的解决方法]
    8
  • 8
    2024 Mysql基础与进阶操作系列之MySQL触发器详解(21)作者——LJS[你个小黑子这都还学不会嘛?你是真爱粉嘛?真是的 ~;以后请别侮辱我家鸽鸽]
    7
  • 9
    2024 RedisAnd Mysql基础与进阶操作系列(19)作者——LJS[你个小黑子这都还学不会嘛?你是真爱粉嘛?真是的 ~;以后请别侮辱我家鸽鸽]
    7
  • 10
    2024 RedisAnd Mysql基础与进阶操作系列(18)作者——LJS[你个小黑子这都还学不会嘛?你是真爱粉嘛?真是的 ~;以后请别侮辱我家鸽鸽]
    5