2月27日,在美国圣克拉拉举行的存储领域顶级会议 USENIX FAST 2026 上,阿里云瑶池数据库 PolarStore 团队的论文《PolarStore: High-Performance Data Compression for Large-Scale Cloud-Native Databases》荣获最佳论文提名(Best Paper Award Candidate)。该成果从全球44篇录用论文(录用率17.4%)中脱颖而出,成为仅有的5篇最佳论文候选之一。
阿里云数据库创新设计了软硬件双层压缩架构,深度融合云原生数据库的 I/O 特征,从而打破数据库与存储间的语义壁垒,消除软硬件压缩功能冗余,实现了高性能、高压缩比与灵活调度的统一。基于此技术,阿里云打造了业界首个商业化落地的软硬协同压缩产品,并已在云原生数据库生产环境中大规模部署应用。该论文由阿里云作为唯一完成单位,系统性地总结了软硬协同压缩的大规模工程实践与技术洞察,为云数据库存储优化树立了新标杆。
FAST 会议(USENIX Conference on File and Storage Technologies,文件与存储技术会议)由美国高等计算系统协会(USENIX)和美国计算机学会操作系统专业组织(ACM SIGOPS)联合组织,创办于2002年,是存储领域公认的国际顶级学术会议,被中国计算机学会(CCF)列为A类会议。
会议聚焦文件系统、云存储、新型存储硬件、数据管理等前沿方向,论文录用标准严格,成果代表行业最高研究水平,深受全球学术界与工业界重视。创办二十余年来,FAST 持续推动着软硬件协同、RAID、闪存文件系统、非易失内存技术和分布式存储等多项关键技术的发展突破,对产业实践产生了深远影响。
PolarDB MySQL/PostgreSQL 版是阿里云自研的云原生数据库,采用软硬件一体化设计,基于高性能存储 PolarStore,100% 兼容 MySQL/PostgreSQL。支持 HTAP、多主多写、多活容灾和内置AI,交易和分析性能最高分别是开源数据库的 2~3 倍和 400 倍,TCO 低于自建数据库 50%。
作为 PolarDB 存储与计算分离架构的核心底座,PolarStore 是一款具有超低延迟和高可用能力的分布式存储系统,对于发挥 PolarDB 特性至关重要。PolarStore 采用了轻量的用户空间网络和 I/O 栈,绕过传统内核栈,充分发挥 RDMA 和 NVMe SSD 等新兴硬件的潜力,极大降低了分布式非易失数据访问的端到端延迟。
FAST 评委点评指出:“论文通过对现有压缩技术的系统性抽象和对行业痛点的精准洞察,创新性地构建了软硬件协同的双层压缩架构;同时,将超大规模、长期稳定运行的工程实践深度反哺学术界,为硬件架构设计、压缩算法优化及智能调度策略等研究方向提供了兼具理论深度与实践价值的参考范式,彰显了工业界前沿实践对学术创新的重要引领作用。”
论文中提出的软硬件协同压缩方案实现了 PolarDB 全链路深度协同:软件层深度感知 InnoDB Page 边界,以 16KB 大块粒度压缩并全链路 I/O 打标;硬件层依托 Smart-SSD 变长 FTL 能力,将压缩块紧凑组织,使软硬件逻辑融合,彻底消除传统方案中的多层 GC 与 I/O 放大问题。线上实践验证,该方案平均压缩比达 3.55 倍,实例级压缩比最高超过 10 倍,且零 I/O 放大、无需垃圾回收。
性能方面,在 100% 兼容 InnoDB 引擎的前提下,仅压缩数据 Page 而绕过 Redo/Binlog 路径,CPU 开销卸载至存储,Redo 链路高效无损,结合 EMP 特性实现性能无损甚至提升;同时支持压缩算法、压缩粒度及单 I/O 策略的动态调整,软件栈简洁无背景流量,杜绝性能抖动。
作为业界首个商业化软硬双压缩产品,该方案显著降低了云数据库存储成本与 TCO,在保障极致稳定性与业务灵活性的同时,为大规模云原生应用提供了高效、经济、可靠的存储底座。
图:PolarStore软硬协同压缩介绍
阿里云瑶池数据库团队独立完成的《PolarStore: High-Performance Data Compression for Large-Scale Cloud-Native Databases》,系统性地总结了软硬协同压缩的大规模工程实践与技术洞察,为云数据库存储优化树立了新标杆。据了解,阿里云原生数据库 PolarDB 已规模化应用于政务、金融、电信、物流、互联网及汽车等行业的核心业务系统,服务理想汽车、小鹏汽车、MiniMax、GoTo 集团、度小满、米哈游、某大型商业银行等全球知名企业,助力开发者加速迈入智能时代。