开发者社区> 问答> 正文

基于Delta lake、Hudi格式的湖仓一体架构的最佳实践背景是什么?

基于Delta lake、Hudi格式的湖仓一体架构的最佳实践背景是什么?

展开
收起
xin在这 2021-12-12 11:07:53 371 0
1 条回答
写回答
取消 提交回答
  • 整个最佳实践是基于MaxCompute的湖仓一体架构,模拟公司使用场景。比如公司 A 使用云上关系型数据库 RDS 作为自己的业务库,同时使用阿里云 EMR 系统做日志数据采集。将数据汇集到云上对象存储 OSS 上,引入了数据湖常会用的存储机制 Delta Lake 和 Hudi 为数据湖提供流处理、批处理能力。通过 MaxCompute 查询到实时数据,即时洞察业务数据变化。 整个场景demo的架构是,云上EMR产生的实时变化的数据,包括在线数据库RDS,通过数据入湖,然后实时的把数据变化体现在归档的OSS 上。同时MaxCompute跟其他引擎一起分析OSS上的数据。

    2021-12-12 12:38:11
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
微服务×容器Meetup:云原生架构与应用专场PPT合辑 立即下载
云原生架构容器&微服务优秀案例集 立即下载
以银行架构视角解读和落实银行数字化转型的两份重磅指导文件 立即下载