阿里云计算平台大数据基础工程技术论文入选 VLDB 2023

简介: 近日,在 VLDB 2023 上,由阿里云计算平台大数据基础工程技术团队主导,与计算平台 MaxCompute 团队、华东师范大学数据科学与工程学院、达摩院合作的论文入选 Industrial Track

近日,在 VLDB 2023 上,由阿里云计算平台大数据基础工程技术团队主导,与计算平台 MaxCompute 团队、华东师范大学数据科学与工程学院、达摩院合作的论文入选 Industrial Track,该论文提出了基于预测的云计算平台资源弹性伸缩框架 MagicScaler,该框架主要包含一个基于多尺度注意力高斯过程的预测模型和一个考虑需求不确定性的弹性伸缩优化决策器。通过基于预测的资源弹性扩缩容,实现了“高QoS(Quality of Service),低成本”的双丰收。

VLDB(International Conference on Very Large Data Bases)会议是计算机科学数据库领域的顶级国际会议,专注于数据库管理系统和大规模数据管理的研究,促进了数据库技术和数据管理领域的学术交流和创新,在学术和工业界都有广泛的影响力。此次入选意味着阿里云提出的基于预测的云计算平台资源弹性伸缩框架获得了国际学者的认可。通过在 VLDB 这样的顶级国际会议上展示阿里云计算平台的创新成果,一方面体现了阿里云的技术竞争力,另一方面也创造了更多国际合作交流的可能性。

随着云计算需求的日益发展,基于用户需求合理地进行云资源分配是保障稳定性和控制成本的重要因素。而云上用户需求往往具有高度复杂性、不确定性和差异性,这给未来需求的准确预测带来了一定困难,也使得主动弹性伸缩更具挑战性。一个好的主动弹性伸缩策略需要在考虑需求不确定性的同时,保持云平台低运行成本和高 QoS 之间的合理平衡。

针对这一问题,MagicScaler 提出了一种预测器与弹性伸缩优化器相结合的主动伸缩框架,首先通过结合多尺度注意力机制和随机过程回归实现精确的需求预测,并量化预测的不确定性;之后基于预测结果,将复杂业务场景建模为马尔可夫决策过程,通过滚动时域求解近似,将量化的未来需求不确定性融入一个随机规划模型中得到推荐的弹性伸缩策略,并实现了资源成本与 QoS 之间的灵活平衡。

目前在阿里云云原生大数据计算服务 MaxCompute 3 个集群的真实数据集上进行了实验,综合成本和 QoS 两个层面,MagicScaler 要显著优于其他经典的弹性伸缩算法。后续将进一步研究如何将 MagicScaler 技术与 MaxCompute 现有调度策略结合。

论文标题:MagicScaler: Uncertainty-aware, Predictive Autoscaling
论文作者:潘志诚,王益杭,张颖莹,杨斌,程云爻,陈鹏,郭晨娟,文青松,田西夺,窦云亮,周志强,杨程程,周傲英,杨彬

论文链接:https://www.vldb.org/pvldb/vol16/p3808-yang.pdf

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
4月前
|
数据可视化 关系型数据库 MySQL
基于python大数据的的海洋气象数据可视化平台
针对海洋气象数据量大、维度多的挑战,设计基于ECharts的可视化平台,结合Python、Django与MySQL,实现数据高效展示与交互分析,提升科研与决策效率。
|
8月前
|
数据采集 人工智能 算法
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
数据没洗干净,分析全白干:聊聊大数据里的“洗澡水”工程
271 1
|
7月前
|
数据采集 人工智能 大数据
10倍处理效率提升!阿里云大数据AI平台发布智能驾驶数据预处理解决方案
阿里云大数据AI平台推出智能驾驶数据预处理解决方案,助力车企构建高效稳定的数据处理流程。相比自建方案,数据包处理效率提升10倍以上,推理任务提速超1倍,产能翻番,显著提高自动驾驶模型产出效率。该方案已服务80%以上中国车企,支持多模态数据处理与百万级任务调度,全面赋能智驾技术落地。
1057 0
|
4月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
397 0
|
7月前
|
分布式计算 算法 大数据
大数据时代的智能研发平台需求与阿里云DIDE的定位
阿里云DIDE是一站式智能大数据开发与治理平台,致力于解决传统大数据开发中的效率低、协同难等问题。通过全面整合资源、高度抽象化设计及流程自动化,DIDE显著提升数据处理效率,降低使用门槛,适用于多行业、多场景的数据开发需求,助力企业实现数字化转型与智能化升级。
340 1
|
10月前
|
传感器 人工智能 安全
云计算平台如何支持智慧工地?
云计算平台作为智慧工地的核心技术,通过整合数据、算力与智能分析能力,为工地管理提供全流程数字化服务。其主要作用体现在五个层面:一是构建数据中枢,实现多源数据整合与边缘计算协同;二是通过AI模型训练和大数据预测,提供智能分析与决策支持;三是多端协同与弹性扩展,满足不同场景需求;四是强化安全与绿色施工,优化能耗并保障数据安全;五是打造生态化平台,开放API接口并采用微服务架构扩展功能。云计算推动工地管理从经验驱动转向数据驱动,未来结合5G与数字孪生技术,将进一步提升实时模拟能力。
478 2
|
11月前
|
存储 资源调度 云计算
什么是云计算平台?如何打造云平台核心要件?
云计算平台基于虚拟化和分布式计算技术,提供灵活、可扩展的计算资源与服务框架,支持跨地域的数据处理和应用运行。它通过集中管理资源、优化分配,提高系统可用性和响应速度,降低运营成本,增强用户体验。平台分为IaaS、PaaS和SaaS三层架构,具备动态资源调度、多租户隔离和服务可靠性等优势。构建要素包括基础框架设计、关键技术组件及运维支撑体系,确保高效、安全的云服务交付。
2362 2
|
11月前
|
SQL 存储 HIVE
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
鹰角基于 Flink + Paimon + Trino 构建湖仓一体化平台实践项目
838 2
|
5月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
418 14
|
7月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
269 4

热门文章

最新文章

相关产品

  • 云原生大数据计算服务 MaxCompute