数据库数字孪生技术获突破,Ganos两项研究成果入选VLDB

本文涉及的产品
云原生数据库 PolarDB MySQL 版,Serverless 5000PCU 100GB
云数据库 Redis 版,社区版 2GB
推荐场景:
搭建游戏排行榜
云原生内存数据库 Tair,内存型 2GB
简介: Ganos率先借助云原生能力研究大规模3D场景和移动对象轨迹的In-database空间计算,研发成果在VLDB的发表,揭开了数据库基础软件在数字孪生3D空间计算方向上的崭新篇章。

近日,国际顶级数据库学术会议VLDB 2022在澳大利亚悉尼举办。阿里云与达摩院空天数据库引擎团队有关Ganos的两项研发成果被VLDB 2022收录。VLDB与SIGMOD、ICDE并称为数据库业界的三大顶级学术会议,收录全球研究机构以及科技企业在数据库领域最前沿、最顶级的研究成果。数据库作为核心基础软件,是底层硬件基础资源与上层应用系统之间的重要桥梁。Ganos率先借助云原生能力研究大规模3D场景和移动对象轨迹的In-database空间计算,研发成果在VLDB的发表,揭开了数据库基础软件在数字孪生3D空间计算方向上的崭新篇章。


将现实世界放进数据库


数字孪生,是指利用物理模型、传感器更新、仿真模拟等技术完成现实世界到虚拟世界的映射。简而言之,就是创造现实世界的数字克隆体,并把它放到计算机管理起来。和传统计算机辅助设计(CAD)不同,这个数字克隆体是会“动”的,发生在现实世界中的变化会实时地反映到数字克隆体上。作为一个新兴技术,数字孪生还有很多的挑战亟待解决,比如用什么模型来表示现实世界的物体、如何存储数字克隆体、如何支持高效的查询和数据更新等。


随着智能城市和数字孪生技术的结合,快速分析与处理大规模的多维、动态、场景化空间数据已构成挑战。例如,建筑的精细化BIM模型数据、网联汽车产生的大量动态轨迹数据,无人机拍摄的实景三维数据等。传统数据库能良好处理整数、浮点数、文本等各种常规数据类型,但如何把一幢摩天大楼数字化后放进数据库?如何对城市中的各类移动车辆的动态数据进行有效管理仍然存在诸多挑战。这种以人、车、建筑等复杂单体(静态或动态)及其动态交互为处理对象的新型数据库需要数据库处理模式的变革,也需很大程度上依赖云算力的极致发挥。Ganos团队通过阿里巴巴达摩院数据库与存储实验室的关键技术突破,并借助阿里云的技术转化,在解决数字孪生背景下如何在数据库中表示和存储现实世界的数字克隆,并支持高效的查询与分析计算问题上实现了阶段性的重要突破。


成果简介


主论文《Ganos: A Multidimensional, Dynamic, and Scene-Oriented Cloud-Native Spatial Database Engine》为阿里云和达摩院的独立研究,分析了数字孪生新技术浪潮背景下,多维、动态、场景化新型空间多模态数据的挑战,介绍了Ganos在云原生关系型数据库PolarDB for PostgreSQL上的实现,包括应用背景、系统架构、支持的数据类型、低成本高可用性扩展存储机制以及多级并行查询等技术。Ganos加持PolarDB数据库,使之成为业界首个具备数字孪生空间计算,且最早系统性支持移动对象和3D场景数据处理能力的云原生数据库。


论文阐述的主要技术创新包括:


对多维、动态、场景化数据提供数据库原生支持。Ganos将多维、动态、场景化数据视为数据库首等公民,提供3DMesh、Trajectory、Raster、PointCloud等新型数据类型与模型体系、多维索引访问方法以及空间查询、时空查询、面向场景查询和跨模态查询复杂能力。


低成本高可用性扩展存储机制。Ganos利用云原生对象存储服务(OSS)大容量、低成本、高可用特性实现了一套扩展存储机制,在保证查询效率的同时大幅扩展了存储容量,并降低了存储成本。


空间多级并行查询处理机制。针对数字孪生场景多维复杂查询耗时长的难题,Ganos结合PolarDB共享存储、存计分离云原生架构特性,创新提出了面向空间计算的多级并行查询处理框架,相较于已有并行机制实现高达一倍以上的性能提升。

与此同时,针对百亿级超大规模轨迹数据的处理,Ganos团队与皇家墨尔本理工大学(RMIT)合作,在本次VLDB大会上联合发表了论文《VRE: A Versatile, Robust, And Economical Trajectory Data System》。论文介绍了功能丰富、强鲁棒性、低成本的大规模弹性轨迹系统VRE的系统设计,而该系统正是阿里云多模数据库Lindorm时空轨迹处理系统的原型。论文阐述了VRE的系统架构、轨迹分段模型、时空索引机制以及两阶段查询处理框架等技术。

3.PNG

VRE系统架构


VRE系统(Lindorm Ganos原型)的功能特性和主要技术创新为:


覆盖丰富的轨迹查询。结合阿里巴巴的实际应用需求,VRE首个全面支持了ID时间查询、空间范围查询、时空范围查询等基础查询,以及近似轨迹搜索、近似轨迹连接、子轨迹近似搜索等高级查询,并且同时支持Fréchet、Hausdorff、 DTW、 LCSS和 EDR距离度量。


高效存储和索引机制。VRE提出了新的轨迹分段模型,在存储成本和过滤性能两方面的综合性能明显优于传统的以轨迹为单位的存储模型以及以轨迹点为单位的存储模型。同时,针对各类查询实现了不同的索引结构,显著提升了查询性能。


两阶段查询处理框架。VRE采用了两阶段查询处理框架,在第一阶段仅使用数据规模小的轨迹元数据进行过滤操作,在第二阶段只对第一阶段无法过滤掉的轨迹数据才读取完整的轨迹做检查。将过滤操作下推到存储层,大幅减少了数据传输开销和查询效率。


优异的性能。实验表明,VRE在存储开销和查询效率方面都表现优异,和现有方法相比,可以实现1/3的存储开销以及高达10倍以上的典型查询效率提升。


行业应用


从实验室到使能百业,Ganos在快速迭代进化。Ganos解决了传统位置多模态大数据使用流程复杂、使用门槛高、应用效率低等问题,实现了位置智能服务的普惠计算,目标使能千行百业。据不完全统计,云上Ganos引擎被创建次数达到3万6千多次,目前已应用到航空航天、自然资源、共享出行、灾害应急、交通物流、远程银行、农业/海洋/水利以及社交/健身/O2O等总计45个不同行业/应用方向。


 / End /  

相关实践学习
使用PolarDB和ECS搭建门户网站
本场景主要介绍基于PolarDB和ECS实现搭建门户网站。
阿里云数据库产品家族及特性
阿里云智能数据库产品团队一直致力于不断健全产品体系,提升产品性能,打磨产品功能,从而帮助客户实现更加极致的弹性能力、具备更强的扩展能力、并利用云设施进一步降低企业成本。以云原生+分布式为核心技术抓手,打造以自研的在线事务型(OLTP)数据库Polar DB和在线分析型(OLAP)数据库Analytic DB为代表的新一代企业级云原生数据库产品体系, 结合NoSQL数据库、数据库生态工具、云原生智能化数据库管控平台,为阿里巴巴经济体以及各个行业的企业客户和开发者提供从公共云到混合云再到私有云的完整解决方案,提供基于云基础设施进行数据从处理、到存储、再到计算与分析的一体化解决方案。本节课带你了解阿里云数据库产品家族及特性。
相关文章
|
14天前
|
存储 关系型数据库 数据库
数据库技术深度解析与未来趋势展望
数据库,简而言之,就是存储数据的仓库。它可以按照一定的规则存储和管理数据,提供数据的增删改查(CRUD)等基本操作。数据库不仅限于存储功能,还具备数据的共享性、持久性和安全性等特点。通过数据库管理系统(DBMS),用户可以方便地对数据进行管理和访问。
43 3
|
15天前
|
NoSQL 大数据 数据处理
现代数据库技术的演进与挑战
传统的数据库管理系统在处理大数据和实时应用方面面临挑战。本文探讨了现代数据库技术如何应对这些挑战,重点关注了分布式数据库、NoSQL 数据库和内存数据库等新兴技术的发展与应用。
|
15天前
|
人工智能 NoSQL 关系型数据库
现代数据库技术发展趋势与应用前景探析
在当今数字化时代,数据库技术正日益成为信息管理与应用开发的核心。本文从现代数据库技术的发展趋势出发,探讨了关系型数据库、NoSQL数据库以及新兴的分布式数据库技术,分析它们在各自领域的优势与挑战。结合实际应用场景,探索现代数据库技术的应用前景,为技术从业者提供思路与参考。
|
17天前
|
存储 监控 数据挖掘
【计算机三级数据库技术】第14章 数据仓库与数据挖掘-
文章概述了数据仓库和数据挖掘技术的基本概念、决策支持系统的发展、数据仓库的设计与建造、运行与维护,以及联机分析处理(OLAP)与多维数据模型和数据挖掘技术的步骤及常见任务。
19 3
|
16天前
|
存储 负载均衡 中间件
构建可扩展的分布式数据库:技术策略与实践
【8月更文挑战第3天】构建可扩展的分布式数据库是一个复杂而具有挑战性的任务。通过采用数据分片、复制与一致性模型、分布式事务管理和负载均衡与自动扩展等关键技术策略,并合理设计节点、架构模式和网络拓扑等关键组件,可以构建出高可用性、高性能和可扩展的分布式数据库系统。然而,在实际应用中还需要注意解决数据一致性、故障恢复与容错性以及分布式事务的复杂性等挑战。随着技术的不断发展和创新,相信分布式数据库系统将在未来发挥更加重要的作用。
|
17天前
|
数据库
【计算机三级数据库技术】第11章 数据库的故障管理--附思维导图
文章概述了数据库故障类型及其解决办法、数据库恢复技术、数据转储、日志文件的使用与格式、硬件容错方案(包括RAID技术和服务器容错技术)、以及数据库镜像与容灭策略。
15 2
|
17天前
|
XML 分布式数据库 数据库
【计算机三级数据库技术】第13章 大规模数据库架构--附思维导图
文章概述了分布式数据库、并行数据库、云计算数据库架构和XML数据库的基本概念、目标、体系结构以及与传统数据库的比较,旨在提供对这些数据库技术的全面理解。
17 1
|
10天前
|
SQL 存储 Oracle
"挑战极限!Oracle数据库精英试炼场:夺命连环5问,你能否一路披荆斩棘,登顶技术巅峰?"
【8月更文挑战第9天】Oracle,数据库领域的巨擘,以卓越的数据处理能力、稳定性和安全性成为企业级应用首选。今天我们带来“Oracle夺命连环25问”。首问:核心组件有哪些?答:实例(含内存结构和后台进程)、物理存储(数据文件、控制文件等)及逻辑存储(表空间、段等)。第二问:如何理解事务隔离级别?答:Oracle支持四种级别,默认READ COMMITTED,避免脏读,但可能遇到不可重复读和幻读。
22 0
|
15天前
|
存储 NoSQL 关系型数据库
现代数据库技术的演进与应用
本文探讨了现代数据库技术在面对日益复杂和庞大的数据需求时的演进路径及其应用实例。从传统关系型数据库到NoSQL和NewSQL,再到分布式数据库系统,我们分析了每种技术的特点、优势和适用场景,并讨论了它们在大数据处理、实时分析和云计算环境中的应用案例。通过本文的阐述,读者将能够深入理解不同数据库技术的选择依据及其在现代技术架构中的关键作用。
|
17天前
|
SQL Oracle 关系型数据库
【计算机三级数据库技术】第12章 备份与恢复数据库--附思维导图
文章概述了数据库备份与恢复的基本概念、SQL Server和Oracle的备份与恢复机制,包括恢复模式、备份类型、还原顺序以及实现恢复的方法。
12 0