Cache 新春 | Tair KVCache 商业化暨开源发布会邀您线上观看!

本文涉及的产品
RDS AI 助手,专业版
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
简介: AI 推理正面临“显存墙”困境:GPU 显存告急、扩容成本高、长序列卡顿。2月4日立春阿里云将发布 Tair KVCache 商业版并开源 KVCache Manager 与 HiSim 仿真工具,联合 NVIDIA Dynamo AIConfigurator 等伙伴打造存算分离的AI基础设施,开启推理效率新范式。

随着 DeepSeek R1、Qwen 2.5 等长文本模型与 Agentic AI 的爆发,推理系统的瓶颈正从“算力”向“显存”转移。GPU 显存告急、扩容成本高昂、长序列推理卡顿,是否成为了阻碍业务创新的“显存墙”?


立春之日,破冰之时,阿里云诚挚邀请您参加《Tair KVCache 商业化暨开源发布会》,一同推开 AI 推理效率的新大门!


💻技术盛宴:六大核心议题,全景揭秘下一代推理底座

  • 从理论突破、开源工具到生产实践、商业服务,覆盖完整落地链路
  • 汇集 NVIDIA Dynamo AIConfigurator、RTP 、Mooncake 等生态伙伴,展现全栈优化实力
  • 企业级 Tair KVCache 商业化服务开箱即用,助力业务快速跨越“显存墙”


本次发布会,阿里云数据库 Tair 团队将重磅开源企业级全局管理服务 Tair KVCache Manager 及高保真仿真工具 Tair-KVCache-HiSim。我们将深度解密 Tair 如何通过存算分离架构,联 NVIDIA Dynamo AIConfigurator、RTP、Mooncake 等生态伙伴,打造“计算-存储-调度”一体化的 AI 基础设施。同时,Tair KVCache 商业版将正式亮相,为企业提供开箱即用、极致性价比的推理加速服务。这不仅是一次产品的发布,更是一场关于 AI 记忆管理的范式革命。


📅 直播时间

2026年2月4日(立春) 14:00

👉 直播链接

点此预约,获取开播提醒:https://www.aliyun.com/activity/database/tair-kvcache-release

发布会海报.jpeg

相关文章
|
4月前
|
人工智能 关系型数据库 分布式数据库
|
2月前
|
人工智能 API 机器人
OpenClaw 用户部署和使用指南汇总
本文档为OpenClaw(原MoltBot)官方使用指南,涵盖一键部署(阿里云轻量服务器年仅68元)、钉钉/飞书/企微等多平台AI员工搭建、典型场景实践及高频问题FAQ。同步更新产品化修复进展,助力用户高效落地7×24小时主动执行AI助手。
27969 224
|
2月前
|
存储 关系型数据库 分布式数据库
阿里云PolarDB PolarStore获得顶会 FAST'26 最佳论文提名
阿里云瑶池数据库PolarStore团队论文《PolarStore: High-Performance Data Compression for Large-Scale Cloud-Native Databases》获得顶会 FAST'26 最佳论文提名(全球仅5篇)。
阿里云PolarDB PolarStore获得顶会 FAST'26 最佳论文提名
|
存储 缓存 NoSQL
阿里云 Tair 联手 SGLang 共建 HiCache,构建面向“智能体式推理”的缓存新范式
本文系统剖析面向智能体推理的 KVCache 技术演进,针对传统机制在长上下文、多轮决策与多智能体协同中的状态膨胀、持久化缺失和缓存孤立三大瓶颈,介绍阿里云 Tair KVCache 团队联合 SGLang 社区推出的 HiCache 分层缓存体系。该方案通过显存-内存-3FS 多级卸载与全局共享,实现缓存命中率提升至80%,TTFT 降低56%,推理 QPS 翻倍,支撑智能体时代的大模型高效推理。
|
4月前
|
监控 安全 Unix
iOS 崩溃排查不再靠猜!这份分层捕获指南请收好
从 Mach 内核异常到 NSException,从堆栈遍历到僵尸对象检测,阿里云 RUM iOS SDK 基于 KSCrash 构建了一套完整、异步安全、生产可用的崩溃捕获体系,让每一个线上崩溃都能被精准定位。
1335 114
|
3月前
|
存储 缓存 算法
SGLang Hierarchical Sparse Attention 技术深度解析
阿里云 Tair 联合 SGLang 推出分层稀疏化框架,通过“稀疏+分层”协同优化,将 KVCache 从 GPU 显存扩展至 CPU 与远端存储,实现计算与存储效率双突破,为百万级超长上下文推理提供新路径。
|
存储 缓存 NoSQL
开源 | 阿里云 Tair KVCache Manager:企业级全局 KVCache 管理服务的架构设计与实现
阿里云 Tair 联合团队推出企业级全局 KVCache 管理服务 Tair KVCache Manager,通过中心化元数据管理与多后端存储池化,实现 KVCache 的跨实例共享与智能调度。该服务解耦算力与存储,支持弹性伸缩、多租户隔离及高可用保障,显著提升缓存命中率与资源利用率,重构大模型推理成本模型,支撑智能体时代的规模化推理需求。
|
3月前
|
负载均衡 关系型数据库 Serverless
阿里云支持鹰角3D新游《明日方舟:终末地》全球开服
鹰角网络新作《明日方舟:终末地》全球公测,下载破3000万。面对高并发、高精度3D交互与实时基建等严苛挑战,阿里云以全栈技术(弹性算力、Serverless数据库、全球网络、全链路可观测)保障稳定流畅体验。(239字)
475 0