北京时间8月30日,数据库国际顶会VLDB在加拿大温哥华开幕,来自阿里云、达摩院及合作者的论文共入选17篇,其中工业赛道(Industrial Track)收录7篇阿里云论文,均刷新中国企业纪录。在VLDB大会现场,阿里云数据库负责人李飞飞作大会特邀主旨演讲时表示,随着云计算基础设施的完善和AI技术的发展,未来云数据库要像乐高积木一样易用、好用。
VLDB(International Conference on Very Large Data Bases)是数据库三大国际顶级学术会议(SIGMOD、VLDB、ICDE)之一,聚焦数据管理、数据库及信息系统研究等领域,设有研究(Research Track)、工业(Industrial Track)等方向,每年收录的成果对于推动数据驱动决策、智能系统演进、应用创新等具有重要意义,在计算机科学和产业实践中均产生了深远影响。今年,清华、北大、MIT、苏黎世联邦理工学院等科研院所,以及阿里、字节、谷歌、AWS等科技公司,均在VLDB展示了数据库科学的最新成果。
VLDB至今已举办至第49届,阿里云、达摩院及合作方共有17篇文章入选VLDB,在中国企业中排名第一。其中,全部作者均来自阿里云的7篇论文成果入选工业赛道,在全球企业中拔得头筹。
VLDB 2023 现场,阿里云李飞飞作特邀主旨演讲《Modernization of Databases in the Cloud Era: Building Databases that Run Like Legos》
阿里云数据库产品事业部负责人李飞飞在大会现场发表特邀主旨演讲《Modernization of Databases in the Cloud Era: Building Databases that Run Like Legos》,他表示 ,云基础设施的完善和AI技术的飞速发展,为数据库架构更新带来了新机遇。“在云时代,如何让用户像堆叠乐高积木一样更简易、更高效地使用数据库,是新一代云原生数据库所努力的方向。以阿里云瑶池数据库的最佳实践为例,PolarDB通过存储-内存-计算三层解耦实现极致Serverless能力,并支持客户以乐高积木的形式按需增加行级多主多写、HTAP、密态计算等多项核心能力。与此同时,AI技术的发展为云原生数据库注入了全新的智能化潜力,可为数据库提供更高的灵活性、可靠性和自适应能力,从而更好满足用户多样化的新需求。”
李飞飞指出,云数据库要像乐高积木一样好用
实现从库的强一致性一直以来都是数据库业内难以突破的技术难题,本次入选VLDB工业赛道的阿里云论文《PolarDB-SCC: A Cloud-Native Database Ensuring Low Latency for Strongly Consistent Reads》颠覆了传统的主从复制架构,提出了一种全新的数据库架构。新架构利用RDMA的多种算子全面重构了主从节间的数据通信模式,通过追踪细粒度的数据修改以及设计新的时间戳方案,并融合基于时间序的新一代事务系统实现了高性能全局一致性读。目前该架构已在PolarDB上线,PolarDB是业内首个在业务无感知情况下实现全局一致性读的主从架构云原生数据库,解决了海量客户的一致性痛点。
PolarDB-SCC架构图,业内首次实现高性能全局一致性读
论文《Eigen: End-to-end Resource Optimization for Large-Scale Databases on the Cloud》介绍了阿里云如何提升数据库资源效率这一公认的行业难题。针对大规模云数据库集群中的资源分配最大化及确保资源可用性之间的两难挑战,提出了一套全新的管理系统Eigen。基于资源流模型,Eigen首次构建了分层资源管理系统并创新三种资源优化算法,实现了端到端的资源优化:整体资源分配率提升27%以上,资源供应延迟率保持在0.1%以下。目前,Eigen已在大规模公共云生产环境中运行超过30个月,覆盖全球30多个地区。
AI技术为数据库带来了智能化的新机会。在研究赛道中,阿里云与达摩院合作的论文《CatSQL: Towards Real World Natural Language to SQL Applications》,介绍了阿里云自研的自然语句转可执行SQL语句(NL2SQL)技术——CatSQL,帮助更多非专业人士更方便高效地实现数据库的专业应用。CatSQL创新地融合了传统的编译原理技术和最新的深度模型技术,可在理解语义的基础上保障语法的正确性,通过领域知识配置和高效的微调技术,在专域场景的准确率高达80%以上。据了解,CatSQL已在阿里云PolarDB等产品中落地使用。
CatSQL架构图
当前,以阿里云为代表的中国科技企业,正在成为引领全球数据库技术创新的中坚力量。过去几年,阿里巴巴有近80篇论文成果被国际数据库顶级会议和期刊收录,研究范围覆盖云原生、智能化、HTAP、安全可信等前沿方向,数量位居中国企业第一。今年,阿里云联合浙江大学斩获2023 SIGMOD最佳论文奖,该奖项历史上首次颁给完全由中国大陆研究人员组成的科研团队,相关成果已率先应用在PolarDB等云原生数据库产品中。