备案控制台

开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

sprak是什么

sprak是什么

展开

收起

爱吃鱼的程序员 2020-12-25 17:31:15 670 0

1 条回答

写回答

取消提交回答

游客2q7uranxketok

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是--Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

Spark 是一种与 Hadoop 相似的开源集群计算环境，但是两者之间还存在一些不同之处，这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越，换句话说，Spark 启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。

Spark 是在 Scala 语言中实现的，它将 Scala 用作其应用程序框架。与 Hadoop 不同，Spark 和 Scala 能够紧密集成，其中的 Scala 可以像操作本地集合对象一样轻松地操作分布式数据集。

尽管创建 Spark 是为了支持分布式数据集上的迭代作业，但是实际上它是对 Hadoop 的补充，可以在 Hadoop 文件系统中并行运行。通过名为 Mesos 的第三方集群框架可以支持此行为。Spark 由加州大学伯克利分校 AMP 实验室 (Algorithms, Machines, and People Lab) 开发，可用来构建大型的、低延迟的数据分析应用程序。

2021-02-03 18:15:07

赞同展开评论打赏

问答分类：

开源大数据平台 E-MapReduce

问答地址：

开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎？

67251

13

0

什么是二进制？二进制怎么算？

25931

32

0

this xml file does not appear to have any style in

12176

4

0

sql server的用户名和密码怎么查啊？

28522

19

0

OSS的endpoint如何查看

26062

3

0

购买阿里国外的云服务器是否可以访问谷歌？

70680

44

0

如果购买了域名，一定要备案才能用吗

27504

22

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

49079

27

0

手机号码定位,是根据什么原理来确定位置的?

22362

29

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

114118

11

0

大数据与机器学习

开源大数据平台 E-MapReduce

阿里云EMR是云原生开源大数据平台，为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎，计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

我要提问

热门讨论

热门文章

阿里云E-MapReduce用自己搭建的DS，调用hive执行sql时，报这个错，是什么原因呢？

阿里云E-MapReduce需要变动什么吗？

计划在新加坡服务器部署集群，阿里云E-MapReduce支持吗？

阿里云E-MapReduce这个ossref 是这样写的吧？

阿里云E-MapReduce中clickhouse或者starrocks 可以做商用化部署吗?

有 E-MapReduce on ECS 的维护手册吗？除了官网的那个，有没有文档形式的那种呢？

请问hive 的hive-site.xml文件在哪啊

阿里云E-MapReduce公司最近Presto所在的服务器，请问这种问题各位有遇到过吗？

大佬，可以请教下，有没有遇到 com.aliyun.oss

我想问一下阿里云E-MapReduce，为什么会报错这个信息呢？

展开全部

阿里封神谈hadoop生态学习之路

现代流式计算的基石：Google DataFlow

如何使用Kafka Connect实现同步RDS binlog数据

Spark in action on Kubernetes - Playground搭建与架构浅析

JindoFS解析 - 云上大数据高性能数据湖存储方案

如何在Aliyun E-MapReduce集群上使用Zeppelin和Hue

HIVE MapJoin异常问题处理总结

JindoFS概述：云原生的大数据计算存储分离方案

Apache Spark 3.0 将内置支持 GPU 调度

【译】用SQL统一所有：一种有效的、语法惯用的流和表管理方法

展开全部

相关电子书

更多

低代码开发师（初级）实战教程 立即下载

冬季实战营第三期：MySQL数据库进阶实战 立即下载

阿里巴巴DevOps 最佳实践手册 立即下载