开源大数据平台 E-MapReduce
关注
阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。
0
今日
1632
内容
13
活动
5420
关注
来自:
大数据与机器学习
Databricks数据洞察:从入门到实践
Delta Lake 作为数据湖核心存储引擎方案能给企业带来诸多的优势。本书从技术基础介绍到场景应用实践,从大数据平台架构的演进、Delta Lake关键特性、实现原理,以及数据仓库、数据湖的优劣势,湖仓一体架构的应用等多方面解析Lakehouse架构和Delta Lake的应用优势。帮助读者入门数据湖Lakehouse以及部分spark相关应用。
31136
137
使用Databricks+Confluent进行实时数据采集入湖和分析【Databricks 数据洞察公开课】
本文介绍网约车模拟数据从产生,发布到流数据服务 Confluent,通过Databricks Structured Streaming进行实时数据处理,存储到LakeHouse,并使用spark和spark sql进行分析的应用实践。
1151
0
0
更多版块
活跃用户
我要发布