开发者社区大数据与机器学习开源大数据平台 E-MapReduce 文章正文

11月14日Spark社区直播【 Spark on Kubernetes & YARN】

2019-11-12 7074

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本次直播将讨论：以Kubernetes为代表的云原生技术越来越流行起来，spark是如何跑在Kubernetes之上来享受云原生技术的红利？Spark跑在Kubernetes之上和跑在Hadoop YARN上又有什么区别？以及Kubernetes 和YARN的差异点是什么。

主题：
Spark on Kubernetes & YARN

点击这里是直播间直达链接（回看链接）

时间
11月14日：19：00-20：00

直播介绍：
以Kubernetes为代表的云原生技术越来越流行起来，spark是如何跑在Kubernetes之上来享受云原生技术的红利？
Spark跑在Kubernetes之上和跑在Hadoop YARN上又有什么区别？以及Kubernetes 和YARN的差异点是什么。

主讲人：
何剑
阿里巴巴高级技术专家，专注于Kubernetes容器云和大数据底层调度以及基础架构，负责阿里巴巴容器平台在线服务和离线计算任务混部。此前就职于Hortonworks, 是Hadoop 社区Committer和PMC成员

请钉钉扫码至群内观看直播，与嘉宾互动有机会获得社区礼物一份。

11月14 直播.png

文章标签：

容器服务Kubernetes版

容器

Kubernetes

分布式计算

资源调度

Spark

关键词：

apache spark yarn

容器服务Kubernetes版spark

apache spark社区

Yarn spark

容器服务Kubernetes版 Spark

相关实践学习

深入解析Docker容器化技术

Docker是一个开源的应用容器引擎，让开发者可以打包他们的应用以及依赖包到一个可移植的容器中，然后发布到任何流行的Linux机器上，也可以实现虚拟化，容器是完全使用沙箱机制，相互之间不会有任何接口。Docker是世界领先的软件容器平台。开发人员利用Docker可以消除协作编码时“在我的机器上可正常工作”的问题。运维人员利用Docker可以在隔离容器中并行运行和管理应用，获得更好的计算密度。企业利用Docker可以构建敏捷的软件交付管道，以更快的速度、更高的安全性和可靠的信誉为Linux和Windows Server应用发布新功能。在本套课程中，我们将全面的讲解Docker技术栈，从环境安装到容器、镜像操作以及生产环境如何部署开发的微服务应用。本课程由黑马程序员提供。     相关的阿里云产品：容器服务 ACK 容器服务 Kubernetes 版（简称 ACK）提供高性能可伸缩的容器应用管理能力，支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力，打造云端最佳容器化应用运行环境。了解产品详情: https://www.aliyun.com/product/kubernetes

开源大数据EMR

土木林森

分布式计算资源调度大数据

【决战大数据之巅】：Spark Standalone VS YARN —— 揭秘两大部署模式的恩怨情仇与终极对决！

【8月更文挑战第7天】随着大数据需求的增长，Apache Spark 成为关键框架。本文对比了常见的 Spark Standalone 与 YARN 部署模式。Standalone 作为自带的轻量级集群管理服务，易于设置，适用于小规模或独立部署；而 YARN 作为 Hadoop 的资源管理系统，支持资源的统一管理和调度，更适合大规模生产环境及多框架集成。我们将通过示例代码展示如何在这两种模式下运行 Spark 应用程序。

土木林森

964 3 3

阿里云基础设施.

人工智能分布式计算调度

打破资源边界、告别资源浪费：ACK One 多集群Spark和AI作业调度

ACK One多集群Spark作业调度，可以帮助您在不影响集群中正在运行的在线业务的前提下，打破资源边界，根据各集群实际剩余资源来进行调度，最大化您多集群中闲置资源的利用率。

阿里云基础设施.

671 26 26

瓴羊Dataphin

SQL 分布式计算资源调度

Dataphin功能Tips系列（48)-如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

如何根据Hive SQL/Spark SQL的任务优先级指定YARN资源队列

瓴羊Dataphin

518 4 4

vohelon

资源调度分布式计算监控

Spark Standalone与YARN的区别？

【6月更文挑战第17天】Spark Standalone与YARN的区别？

vohelon

842 57 57

众所周知

分布式计算资源调度 Hadoop

Spark Standalone与YARN的区别？

本文详细解析了 Apache Spark 的两种常见部署模式：Standalone 和 YARN。Standalone 模式自带轻量级集群管理服务，适合小规模集群；YARN 模式与 Hadoop 生态系统集成，适合大规模生产环境。文章通过示例代码展示了如何在两种模式下运行 Spark 应用程序，并总结了两者的优缺点，帮助读者根据需求选择合适的部署模式。

众所周知

829 3 3

众所周知

分布式计算资源调度 Hadoop

Spark Standalone与YARN的区别？

【10月更文挑战第5天】随着大数据处理需求的增长，Apache Spark 成为了广泛采用的大数据处理框架。本文详细解析了 Spark Standalone 与 YARN 两种常见部署模式的区别，并通过示例代码展示了如何在不同模式下运行 Spark 应用程序。Standalone 模式自带轻量级集群管理，适合小规模集群或独立部署；YARN 则作为外部资源管理器，能够与 Hadoop 生态系统中的其他应用共享资源，更适合大规模生产环境。文章对比了两者的资源管理、部署灵活性、扩展性和集成能力，帮助读者根据需求选择合适的部署模式。

众所周知

451 1 1

刘大猫.

消息中间件分布式计算 Java

Linux环境下 java程序提交spark任务到Yarn报错

刘大猫.

556 5 5

嘟嘟嘟嘟嘟嘟

SQL 弹性计算资源调度

云服务器 ECS产品使用问题之bin/spark-sql --master yarn如何进行集群模式运行

云服务器ECS（Elastic Compute Service）是各大云服务商阿里云提供的一种基础云计算服务，它允许用户租用云端计算资源来部署和运行各种应用程序。以下是一个关于如何使用ECS产品的综合指南。

嘟嘟嘟嘟嘟嘟

341 7 7

孜倦与shine

分布式计算 Kubernetes Spark

大数据之spark on k8s

孜倦与shine

1072 2 2

大数据与机器学习

11月14日Spark社区直播【 Spark on Kubernetes & YARN】

开源大数据平台 E-MapReduce

热门文章

最新文章

相关课程

相关电子书

推荐镜像