让数据与AI贴得更近,阿里云瑶池数据库系列产品焕新升级

本文涉及的产品
RDS Agent(兼容OpenClaw),2核4GB
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: 4月9日阿里云AI势能大会上,阿里云瑶池数据库发布重磅新品及一系列产品能力升级。「推理加速服务」Tair KVCache全新上线,实现KVCache动态分层存储,显著提高内存资源利用率,为大模型推理降本提速。

4月9日阿里云AI势能大会阿里云瑶池数据库发布重磅新品及一系列产品能力升级。「推理加速服务」Tair KVCache全新上线,实现KVCache动态分层存储,显著提高内存资源利用率,为大模型推理降本提速。


此外,阿里云瑶池核心产品已全面支持In-DB AI,通过内嵌“模型即算子”能力,让数据距离AI更近,实现用户数据内循环、不出域,显著提升推理效率。云原生数据库PolarDB for AI功能升级,通过SQL语句即可调用内置大模型,为用户提供开箱即用的AI能力。

image.png

阿里云副总裁、数据库产品事业部负责人李飞飞


“AI已进入应用爆发阶段,而数据正是企业级AI应用的核心资产。”阿里云副总裁、数据库产品事业部负责人李飞飞表示。“面向多模态的数据处理需求,阿里云瑶池数据库作为承载数据的AI基础设施,旨在为用户提供更普惠、易用的一站式多模数据管理平台。在Data+AI的驱动下,我们将助力用户进一步简化并降低AI应用的开发成本,显著提升计算效率,让数据价值得到充分释放。”


会上,阿里云发布全新「推理加速服务」Tair KVCache,专为大模型推理场景量身打造,通过构建“显存—内存—存储”三级缓存体系,实现“分级缓存架构”升级,解决了推理中的显存瓶颈问题。在提升计算效率的同时,Tair KVCache显著扩展上下文长度,为万亿参数模型的高效推理提供技术保障,构建以缓存为中心的大模型Token超级工厂。

image.png

针对AI应用需求的爆发式增长,阿里云瑶池数据库的核心产品已全面集成In-DB AI能力。据权威机构Gartner预测,2028年80%的生成式AI业务应用将在企业现有的数据管理平台上开发,从而将实施复杂性和交付时间缩短50%。瑶池数据库通过内嵌“模型即算子”(Model as an Operator)能力,让AI距离数据更近。用户无需移动数据,即可在数据库内部完成模型部署至推理的全流程,实现用户数据内循环、不出域,显著提升推理效率并降低开发门槛

image.png

面向企业级智能应用开发,阿里云瑶池还推出了一站式RAG和MCP(模型上下文协议)支持,简化知识问答、智能推荐等场景的开发流程。 


结合大模型与生成式AI技术,阿里云瑶池旗下的一站式数据管理平台DMS为用户提供了一套面向Data Agent的全链路创新框架。该框架以企业数据资产为核心,依托数据库提供的异构算力资源实现专属模型高效部署,并通过瑶池生态提供的多模态数据准备能力与数据链接服务,助力用户构建从数据治理到模型应用的Data Agent全链路部署

image.png

DMS现已深度集成主流LLMOps平台(Dify、百炼等),支持用户基于业务流程对Data Agent进行场景化编排。目前,该方案已服务超100家企业,在CRM、智能客服、质检、企业大脑、Chat2DB等场景中落地。同时,DMS还为Data Agent瑶池生态提供了效果自调优及模型SFT工具,实现Data Agent的可持续演进,旨在帮助用户在Gen AI时代构建下一代智能数据服务范式

image.png

哔哩哔哩Bilibili猫耳事业部Al Infra资深工程师陈刚

哔哩哔哩Bilibili猫耳事业部Al Infra资深工程师陈刚在大会演讲时分享道:


“阿里云DMS+AnalyticDB解决方案为猫耳FM提供智能问数服务,通过自然语言实现高效取数、分析及报表生成,准确率达95%+,大幅降低了我们的数据使用门槛。其知识管理服务自动解析历史操作及字段注释,冷启动效率提升5倍,知识维护成本下降90%,并结合大模型灵活优化场景适配。


该方案助力猫耳FM实现数据交付效率提升3倍,存储传输成本优化,赋能主播与运营人员自助分析,实现高性价比的实时数据服务能力。”

image.png

云原生数据库PolarDB在会上发布内置大模型的PolarDB for AI功能,植入通义千问和DeepSeek全系产品,同时支持用户自定义模型,助力个人和企业开发者快速部署并上线AI应用。借助PolarDB AI节点,用户可直接通过SQL语句调用内置大模型,完成复杂分析任务,并在数据库内进行搜索和推理优化。其在线推理吞吐量可提升10倍以上,显著降低用户的部署成本。据悉,目前PolarDB AI节点已助力100余家大型客户提高在线推理效率,大幅提升业务效果。 

image.png

目前,由Data+AI驱动的阿里云瑶池数据库已在政务、金融、互联网、汽车、游戏等行业的核心业务系统落地,服务于月之暗面Kimi智能助手、MiniMax、哔哩哔哩、小鹏汽车、理想汽车、零跑汽车、雅迪、宝宝树知名企业,通过AI助力业务加速创新升级,共创AI时代的新未来。

相关文章
|
7月前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
3849 166
|
7月前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
7月前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
1221 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
7月前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
7月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1963 75
|
8月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1569 84
|
7月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
780 30
|
7月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
779 2
|
7月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
7月前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
485 3