媒体声音|PolarDB再升级:欢迎来到云数据库 x AI新时代

本文涉及的产品
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
云原生数据库 PolarDB 分布式版,标准版 2核8GB
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
简介: 让个人开发者和企业用户都可以像“搭积木”一样开发和管理数据库

以下文章来源于产业家,作者产业媒体


作者|思杭

编辑|皮爷

出品|产业家


“搭积木”、“自动驾驶”、“三层解耦”,这些形象的标签成了1月17日阿里云开发者生态大会当天最出圈的词汇。


会上,一名小学生受邀上台演示了数据库查询的场景。一种“全民编程”的气氛向现场观众席卷而来。而让个人开发者和企业用户都可以像“搭积木”一样开发和管理数据库,这也正是阿里云在2024年甚至更长时间里的新愿景。



而AI,正是其中的关键武器。


从IBM小型机,到Oracle“统治”时代,再到以AWS、GCP等云数据库巨头引领的新时代,全球数据库行业交错发展了40年之久。而在最近的十年时间里,国产数据库成为新的弄潮儿。


2023年底,一张亮眼的成绩单新鲜出炉。阿里云瑶池数据库入选Gartner云数据库魔力象限,并连续4年蝉联“领导者”地位。



而与之对应的一个事实是,在国内云计算行业增速放缓的背景下,入选企业只有阿里云一家。放眼国际,IBM、SAP等传统商业数据库厂商,均跌出“领导者”象限。


云数据库正是其中的主角。实际上,在不少数据库企业的眼中,云数据库都被视为一个国内数据库行业换道超车的机会。其中不仅包括公有云大势所趋的推动,更重要的是云数据库所涉及到的底层创新,如存算分离和软硬一体技术等等,也正在成为数据库行业的新潮流。


2023年,据墨天轮统计,云数据库占国内数据库总数的20%。而早在2021年,中国信通院就做出相关预测。“80%的企业都认为云数据库是未来数据库行业的发展方向。”


在大模型一路“狂飙”的今天,云数据库又来到了超车关口。


从传统数据库到云数据库的“新需求面”


在很长一段时间里,业务高峰期间的流量指数级增长都是企业最怕遇到的问题,比如双十一期间的淘宝和春运期间的12306等等。这已经成为一种行业共识。


而在流量爆表的另一面,业务也对数据库,尤其是传统数据库提出了极高的要求,包括存储、计算等一系列环节都成为不少企业难以解决的问题。


根据一组不完全数据统计,在过去几年里,有超过70%的新型企业都因海量数据的挑战而对业务产生了影响。


天猫双十一是最常见的例子。每年双十一大促的,入驻天猫的商家都深知一个“爆款规则”,即提前几周乃止一个月对企业自身数据库计算能力和存储量做临时升配。


但尽管如此,在双十一流量高峰期间,客户的数据库还是会出现了问题。具体来看,由于传统数据库需要进行定期运维,而这种运维升级所需要的时间是6-8个小时。在此期间,不仅企业需要支付高昂的运维成本,更严重的情况则是由于资源冲突导致的升配失败。


在零售之外,中国联通这类的大型企业也在面临同样的问题。


与互联网业务不同的是,互联网业务交易量大,但速度快。而联通业务的特点则是会遇到多种需求,业务链条极长。


比如看似十分简单的选手机号的业务,一整条链条需要涉及到手机号码选择、套餐选择、开网,以及实名校验和反电信诈骗各种校验。


这种业务复杂、链条冗长的场景,对联通内部的IT系统是一个极大的考验,其不论是运维还是维护,都需要保持业务无感知以及绝对的安全,否则一旦出现问题将影响每个用户的日常生活。在这些之外,更要注意成本。因此,同样地,留给其内部数据库管理的难度极大。


实际上,不论是电商企业,还是如中国联通这样的大型运营商,传统数据库高企的成本和业务对弹性的运维需求也恰在成为采用云数据库的最强推动力。因此,极低的运营成本和弹性存储、计算便成为了对数据库企业的刚性需求。


根据不完全统计,在面对业务高峰带来的峰值时,云数据库的最大优势便是可以为企业提供弹性扩缩容能力。在这种弹性场景下,云原生数据库PolarDB的成本可低至传统商业数据库的十分之一。


另外,在厂商的帮助下,云原生数据库可以做到开箱即用,服务商提供从安装、部署到运维的全流程服务,基于云端的运维和弹性存储计算等进一步降低企业的运营和使用成本。


根据中国信通院报告显示,2022年中国公有云数据库市场规模为219.15亿元,较2021年增速51.6%,而本地部署的增速为14.4%。


解耦、AI、积木:从弹性运维到智能运维


而在这个确定性的趋势之下,阿里云又向前了一步。


1月17日,阿里云PolarDB开发者大会上发布了“三层分离”的新版本,基于智能决策实现查询性能10倍提升、节省50%数据库成本。


而这里的“三层解耦/三层分离”则是阿里云的特殊标签。


此前,在过去40多年的数据库行业发展中,一个极为普遍的情况是数据库的计算与内存都是绑定在一起的,也就是俗称的存算一体。其中部分数据库可以做到计算和存储资源进行解耦,不过没有数据库能做到计算和内存的解耦。


但对于数据库而言,计算、内存和存储资源全部绑定在一起,这种强耦合性会极大地限制数据库的弹性能力,很难进行跨机迁移。


而放在现实生活中,最常见的例子是在淘宝双十一流量高峰,如果计算和内存无法进行分离,最直接的影响一方面是企业的数据库部署和运营成本十分高昂,另一方面则是对企业的计算资源造成极大的浪费。


这也是阿里云“三层解耦”方案的价值之处。


这种强解耦不仅带来的是运维和成本上的弹性,更在产品体验层面被强化。“未来,个人开发者和企业用户可以像‘搭积木’一样开发和管理数据库。”阿里云数据库产品事业部负责人李飞飞表示。


实际上,所谓的“搭积木”,其核心逻辑在于,在统一源数据管理和保证多租户隔离的前提下,企业可以自主调用搭配阿里云数据库的产品组件,包括计算单元、存储引擎、向量引擎能力等等,满足业务对数据库的精准需求,而对阿里云而言,则是真正从原子化的层面满足企业自身需求。


因云而生的PolarDB数据库,天生拥有云计算的弹性、高可用等优势。除了“三层解耦”架构,PolarDB在业界开创性地落地了多主多写、集中与分布式一体化等一系列前沿技术。其中,PolarDB分布式版支持分布式事务、全局二级索引等特性,让开发者像使用单机数据库一样、获得高性能分布式数据库的一体化体验。


从具体效果来看,“搭积木”的体现,一方面是刚刚提到的极致弹性,另一个则是强Severless能力。


对Severless化的一个通俗解释是,其更像一种按需付费的交付方式,用户不需要担心数据库的存储、计算等资源问题,也无需进行配置和维护、更新,可以大幅节省在服务上花费的时间和资源。


对企业而言,其只需要将重心放到本身的业务逻辑即可。


早在2017年,Serverless就在国内落地,也正是在这一年阿里云推出Serverless平台。后来,随着Serverless平台逐渐深化,“像搭积木一样简易”这样的愿景也开始一点点落地。


而在其中,AI是非常重要的价值工具。“在大模型时代,谁能够让整个端到端的流程更简单、更易用,谁就会在市场上占据先发优势。”李飞飞表示。


更客观来看,不论是弹性运维,还是Serverless,其本身都是对数据库产品力和使用体验的进一层深化,而如今在大模型的加持下,数据库的产品力将更为强大。


除了已有的向量引擎等数据库底层进化之外,李飞飞告诉我们,在数据库的智能运维方面,阿里云通过AI大模型能力,可以对企业内部的业务数据进行智能监控,再加上AI的智能分析能力,在一定程度上减少数据库维护、更新等人工成本。


再比如在数据库产品的服务层面,基于大模型可以对工单进行更为高效的管理,如今,这项能力已经在阿里云数据库团队内部使用。


“数据库和大模型结合的想象力很丰富,包括原有的BI,商业数据分析过等过去企业内部基于数据的动作,未来仍然会存在,但是会基于大模型的场景进行,这个想象力也是无穷的。”


2024,走到数据库的关口


实际上,我们再来看这个命题:即大模型究竟能为数据库做些什么?


继2023年,大模型“狂飙”了一年后,关于这样的讨论在持续发酵。甚至几乎所有大厂都All in AI来做大模型。


但就目前而言,与大模型结合更多可落地的场景在于上层应用,如AI Agent,或者与SaaS工具层的结合。而对于底层的数据库而言,大模型对数据库行业造成的潜在影响则在于智能化。


从大模型与数据库的本质进行分析,大模型需要依托海量的数据来训练、学习,而数据库的作用则是进行存储、筛选和处理数据。


因此,两者碰撞在一起的想象力,则可以通过可视化工具,来进行配合,比如通过大模型进行数据的收集、标签管理、数据资产沉淀,再利用AI大模型能力进行数据智能分析,并以清晰可视化的方式,实现真正的数据和业务结合。


这也是目前企业里较为常见的需求,即将数据库与AI和BI相结合的方向。


而从这些视角来理解,其实不难看出对当下而言,数据库行业正在坚定地发生一些变化。


首先,站在更大的行业视角,在云数据库成为新趋势的背景下,云数据库成为了国产数据库企业换道超车的新机会。而在此基础上,像阿里云所推出的“三层解耦”和“搭积木”理念,再加上AI加持的智能运维能力,也更是加速了云数据库替代传统商业数据库的趋势。


在过去2023年,整个数据库市场已经站上了数字路口的开始。从去年Gartner发布的云数据库魔力象限就可以发现,IBM、SAP等传统商业数据库厂商,均跌出“领导者”象限。


而从过往的历史趋势来看,一直以来在数据库行业具有“统治者”地位的Oracle也在云计算时代由于战略判断失误而失去了其原本的霸主地位。


而另一组根据信通院的统计则是,目前国内数据库有接近300家公司,这里面包括OLTP、OLAP、NoSQL等类型,已经被大量应用在企业业务中。


李飞飞告诉我们,未来坚持传统软件思维模式的数据库企业会越来越艰难。“坚持云原生化、平台化、一体化和智能化,才是数据库的下一个方向和未来。”


云原生化意味着企业从购买资源向购买能力转变,加速数据业务上云。其中“三层解耦”和Serverless能力便是最好的体现。


平台化对应的是基于平台来提供一站式的能力和解决方案,比如通过提供标准的API接口体系来减少业务烟囱。


一体化则是聚焦客户的业务场景,通过多产品一体化的体验,来简化开发、管理和运维,避免数据搬迁。如处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化。


最后,智能化便是结合AI提升运维效率和查询效率等等。而放在未来的大模型时代,智能化的想象力和应用力也将会越来越丰富。


不难看出,2024年数据库行业在AI的推动下,既定的云端进化速度正在加速。而伴随着市场和企业对于云数据库需求的越发增加,中国数据库厂商正在成为一股不可忽视的力量。


“核心还是持续为客户创造更大的价值,这是阿里云数据库和PolarDB产品的根本使命。”李飞飞说道。

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
目录
打赏
0
0
3
0
2357
分享
相关文章
拥抱Data+AI|“全球第一”雅迪如何实现智能营销?DMS+PolarDB注入数据新活力
针对雅迪“云销通App”的需求与痛点,本文将介绍阿里云瑶池数据库DMS+PolarDB for AI提供的一站式Data+AI解决方案,助力销售人员高效用数,全面提升销售管理效率。
PolarDB 开源基础教程系列 7.4 应用实践之 AI大模型外脑
PolarDB向量数据库插件通过实现通义大模型AI的外脑,解决了通用大模型无法触达私有知识库和产生幻觉的问题。该插件允许用户将新发现的知识和未训练的私有知识分段并转换为向量,存储在向量数据库中,并创建索引以加速相似搜索。当用户提问时,系统将问题向量化并与数据库中的向量进行匹配,找到最相似的内容发送给大模型,从而提高回答的准确性和相关性。此外,PolarDB支持多种编程语言接口,如Python,使数据库具备内置AI能力,极大提升了数据处理和分析的效率。
26 4
PolarDB-PG AI最佳实践3 :PolarDB AI多模态相似性搜索最佳实践
本文介绍了如何利用PolarDB结合多模态大模型(如CLIP)实现数据库内的多模态数据分析和查询。通过POLAR_AI插件,可以直接在数据库中调用AI模型服务,无需移动数据或额外的工具,简化了多模态数据的处理流程。具体应用场景包括图像识别与分类、图像到文本检索和基于文本的图像检索。文章详细说明了技术实现、配置建议、实战步骤及多模态检索示例,展示了如何在PolarDB中创建模型、生成embedding并进行相似性检索
PolarDB-PG AI最佳实践 2 :PolarDB AI X EAS实现自定义库内模型推理最佳实践
PolarDB通过POLAR_AI插件支持使用SQL调用AI/ML模型,无需专业AI知识或额外部署环境。结合阿里云EAS在线模型服务,可轻松部署自定义模型,在SQL中实现如文本翻译等功能。
跨云数据管理平台DMS:构建Data+AI的企业智能Data Mesh
跨云数据管理平台DMS助力企业构建智能Data Mesh,实现Data+AI的统一管理。DMS提供开放式元数据服务OneMeta、一站式智能开发平台和云原生AI数据平台,支持多模数据管理和高效的数据处理。结合PolarDB、AnalyticDB等核心引擎,DMS在多个垂直场景中展现出显著优势,如智能营销和向量搜索,提升业务效率和准确性。通过DataOps和MLOps的融合,DMS为企业提供了从数据到AI模型的全生命周期管理,推动数据驱动的业务创新。
PolarDB-PG AI最佳实践 1:基础能力实践
Polar_AI 是 PolarDB 数据库的 AI 扩展,集成了先进的人工智能模型和算法,使数据库能够执行机器学习和自然语言处理任务。它支持 PostgreSQL 及 Oracle 兼容版本,通过标准 SQL 轻松调用 AI 模型,具备简单易用、灵活可定制、无缝数据融合、数据安全和高性能等优势。用户可以通过 SQL 快速实现文本转向量、情感分类等功能,并能自定义扩展 AI 模型。
让PolarDB更了解您--PolarDB云原生数据库核心功能体验馆
让PolarDB更了解您——PolarDB云原生数据库核心功能体验馆,由阿里云数据库产品事业部负责人宋震分享。内容涵盖PolarDB技术布局、开源进展及体验馆三大部分。技术布局包括云计算加速数据库演进、数据处理需求带来的变革、软硬协同优化等;开源部分介绍了兼容MySQL和PostgreSQL的两款产品;体验馆则通过实际操作让用户直观感受Serverless、无感切换、SQL2Map等功能。
107 7
PolarDB 开源基础教程系列 8 数据库生态
PolarDB是一款开源的云原生分布式数据库,源自阿里云商业产品。为降低使用门槛,PolarDB携手伙伴打造了完整的开源生态,涵盖操作系统、芯片、存储、集成管控、监控、审计、开发者工具、数据同步、超融合计算、ISV软件、开源插件、人才培养、社区合作及大型用户合作等领域。通过这些合作伙伴,PolarDB提供了丰富的功能和服务,支持多种硬件和软件环境,满足不同用户的需求。更多信息请访问[PolarDB开源官方网站](https://openpolardb.com/home)。
37 4
PolarDB PostgreSQL版:商业数据库替换与企业上云首选
PolarDB PostgreSQL版是商业数据库替换与企业上云的首选。其技术架构实现存储计算分离,具备极致弹性和扩展性,支持Serverless、HTAP等特性。产品在弹性、性能、成本优化和多模处理方面有显著提升,如冷热数据自动分层、Ganos多模引擎等。已在汽车、交通、零售等行业成功应用,典型案例包括小鹏汽车、中远海科等,帮助企业大幅降低运维成本并提高业务效率。
46 13
PolarDB分布式版:与云融合的分布式数据库发展新阶段
PolarDB分布式版标志着分布式数据库与云融合的新阶段。它经历了三个发展阶段:从简单的分布式中间件,到一体化分布式架构,再到云原生分布式数据库。PolarDB充分利用云资源的弹性、高性价比、高可用性和隔离能力,解决了大规模数据扩展性问题,并支持多租户场景和复杂事务处理。零售中台的建设背景包括国家数字化转型战略及解决信息孤岛问题,采用分布式数据库提升高可用性和性能,满足海量订单处理需求。展望未来,零售中台将重点提升容灾能力、优化资源利用并引入AI技术,以实现更智能的服务和更高的业务连续性。

相关产品

  • 云原生数据库 PolarDB
  • 云数据库 RDS
  • AI助理

    你好,我是AI助理

    可以解答问题、推荐解决方案等