备案控制台

开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

Databricks如何集群管理？

Databricks如何集群管理？求大佬解答

展开

收起

爱吃鱼的程序员 2020-12-28 13:56:44 697 0

1 条回答

写回答

取消提交回答

爱吃鱼的程序员

https://developer.aliyun.com/profile/5yerqm5bn5yqg?spm=a2c6h.12873639.0.0.6eae304abcjaIB

对于数据分析师来说，最后还是要进行计算，就牵涉计算资源的管理，那么YipitData是怎么做的呢？我们知道，搭建一个Spark集群并不是很难，但是如何搭建一个能够最优化地解决问题的Spark集群并不是那么容易，因为Spark集群有非常多的配置，而这项工作如果交给数据分析师来做的话就更不简单了。为了解决易用性的问题，YipitData的工程师参照T-Shirt的Size划分巧妙地将集群划分成SMALL、MEDIUM、LARGE三类，如下图所示，数据分析师在使用的时候虽然少了灵活性，但是节省了很多集群配置的时间，大大的提高了工作效率。背后的原理也是进行更深层次的封装，将众多参数设置隐藏起来，数据分析师只需要像选择T-Shirt的尺寸一样做选择即可，而无需关心背后的复杂配置如何实现。

2020-12-28 14:35:23

赞同展开评论打赏

问答分类：

开源大数据平台 E-MapReduce

问答地址：

开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

EMR+PAI 集成主要体现在哪？

333

1

0

什么是 EMR 生态集成？

339

1

0

在EMR半托管状态下，用户如何部署EMR任务？

357

1

0

构建LakeHouse方案，Databricks如何开展？

551

1

0

StarRocks 是开源的吗？

357

1

0

EMR StarROcks集群购买后，是不是还需要自己搭建和维护，其他的大数据组件

429

1

0

在 Flink 全托管中使用 Hologres 维表有什么限制？

843

1

0

以EMR构建的数据湖计算体系是什么样的？

446

1

0

EMR云原生数据湖计算平台是什么？

560

1

0

Serverless Presto是做什么的？

416

1

0

大数据与机器学习

开源大数据平台 E-MapReduce

阿里云EMR是云原生开源大数据平台，为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎，计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

我要提问

热门讨论

热门文章

阿里云E-MapReduce notebook 大概什么时候会正式上线？

E-MapReduce和MaxCompute的区别是什么？

E-MapReduce由于某些未知错误、异常或失败，请求处理失败？

E-MapReduce(Elastic MapReduce，EMR) 是什么？

阿里云E-MapReduce这种命令方式，如何配置kerberos相关的参数？

Cosco的优势是什么？

数据湖统一元数据服务需要具备哪些能力和价值？

各位大佬，请教下flink sink到oss按官网上的报找不到endpoint，我要想在idea中运

Spark3 Join Hints是什么？

Ray是什么？

展开全部

阿里封神谈hadoop生态学习之路

现代流式计算的基石：Google DataFlow

如何使用Kafka Connect实现同步RDS binlog数据

JindoFS: 云上大数据的高性能数据湖存储方案

首次揭秘|为6.4亿人次出行提供无线网络的技术架构

5W1H(六何分析法)全景洞察大数据

助力云上开源生态 - 阿里云开源大数据平台的发展

在 Apache Spark 中利用 HyperLogLog 函数实现高级分析

从数砖开源 Delta Lake 说起

Apache Spark 3.0 将内置支持 GPU 调度

展开全部

相关课程

更多

EMR Serverless StarRocks 介绍

61

1

去学习

EMR Serverless StarRocks 3.1 存算分离介绍

40

1

去学习

基于阿里云Hologres&Flink实时计算平台搭建数据仓库（实时）

341

23

去学习

基于阿里云MaxCompute搭建数据仓库（离线）

1139

70

去学习

EMR Studio 大数据处理最佳实践课程

148

2

去学习

StarRocks 3.0 系列解读

125

1

去学习

相关电子书

更多

EMR StarRocks 白皮书 立即下载

自建Hadoop数据如何托管到MaxCompute 立即下载

自建Hadoop数据如何托管到MaxCompute 立即下载

相关实验场景

更多