业务架构图
ApsaraDB 在线数据库擅长在线查询场景,X-Pack Spark为在线数据库用户提供混合负载的能力,主要包括:
流式处理及入库:Spark Streaming为数据库提供流式ETL入库(延迟s级别)。
生态打通:Spark的多数据源能力,提供外部数据源批量入库、联邦分析能力。
复杂计算及算法:支持SQL、Python、Java、scala、R多语言,支持复杂的数据过程处理(类似PL/SQL)、机器学习等。
离线数仓(复杂分析):一键归档数据到Spark,为数据库添加PB级别离线数仓能力,支持复杂分析,提供天/月级别的报表等。
非结构化处理:搭配HDFS/OSS存储为数据库添加非结构化数据存储处理能管理(CSV、XML、Parquet多种存储)。