备案控制台

开发者社区大数据与机器学习开源大数据平台 E-MapReduce 文章正文

3月5日JindoFS系列直播【Hadoop Job committer 的演化和发展】

2020-03-03 1635

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

EMR Serverless StarRocks，5000CU*H 48000GB*H

简介： Job Committer是Mapreduce/Spark等分布式计算框架的重要组成部分，为分布式任务的写入提供一致性的保证，本次分享主要介绍Job Committer的演进历史，以及社区和EMR在S3/OSS等云存储上的最新进展。

相关阅读推荐：【通过Job Committer保证Mapreduce/Spark任务数据一致性】

主题：

Hadoop Job committer 的演化和发展

点击这里是直播间直达链接（回看链接）

时间

2020.3.5（周四）19:00

直播介绍：

Job Committer是Mapreduce/Spark等分布式计算框架的重要组成部分，为分布式任务的写入提供一致性的保证，本次分享主要介绍Job Committer的演进历史，以及社区和EMR在S3/OSS等云存储上的最新进展。

主讲人：

李呈祥，花名司麟，阿里云智能EMR团队高级技术专家，Apache Hive Committer， Apache Flink Committer，目前主要专注于EMR产品中开源计算引擎的优化工作。

请钉钉扫码至群内观看直播，与嘉宾互动有机会获得社区礼物一份。
Hadoop Job committer 的演化和发展3.5.png

文章标签：

开源大数据平台 E-MapReduce

流计算

分布式计算

SQL

对象存储

Spark

Apache

Hadoop

HIVE

存储

关键词：

hadoop job

jindofs hadoop

jindofs直播hadoop job committer

hadoop演化

相关实践学习

基于EMR Serverless StarRocks一键玩转世界杯

基于StarRocks构建极速统一OLAP平台

快速掌握阿里云 E-MapReduce

E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上，利用开源大数据生态系统，包括 Hadoop、Spark、HBase，为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。本课程主要介绍阿里云 E-MapReduce 的使用方法。

阿里云E-MapReduce团队

目录

相关文章

听风de歌

|

3月前

|

分布式计算资源调度监控

Hadoop中运行Job

【7月更文挑战第10天】

听风de歌

42 2 2

听风de歌

|

3月前

|

分布式计算 Hadoop 测试技术

Hadoop 配置Job使用Combiner来缓解数据倾斜

【7月更文挑战第6天】

听风de歌

34 5 5

auqbllxiu

|

分布式计算 Hadoop

《Why is my Hadoop job slow》电子版地址

Why is my Hadoop* job slow

auqbllxiu

53 0 0

《Why is my Hadoop job slow》电子版地址

怒放de生命

|

分布式计算 Hadoop 索引

hadoop之多job串联(倒排索引案例）(15)

hadoop之多job串联(倒排索引案例）(15)

怒放de生命

83 0 0

hadoop之多job串联(倒排索引案例）(15)

游客dk64xrhekz3ko

|

存储分布式计算 Hadoop

Hadoop中的MapReduce框架原理、Shuffle机制、Partition分区、自定义Partitioner步骤、在Job驱动中，设置自定义Partitioner、Partition 分区案例

Hadoop中的MapReduce框架原理、Shuffle机制、Partition分区、自定义Partitioner步骤、在Job驱动中，设置自定义Partitioner、Partition 分区案例

游客dk64xrhekz3ko

196 0 0

Hadoop中的MapReduce框架原理、Shuffle机制、Partition分区、自定义Partitioner步骤、在Job驱动中，设置自定义Partitioner、Partition 分区案例

游客dk64xrhekz3ko

|

存储 XML 缓存

Hadoop中的MapReduce框架原理、Job提交流程源码断点在哪断并且介绍相关源码、切片与MapTask并行度决定机制、MapTask并行度决定机制

Hadoop中的MapReduce框架原理、Job提交流程源码断点在哪断并且介绍相关源码、切片与MapTask并行度决定机制、MapTask并行度决定机制

游客dk64xrhekz3ko

132 0 0

Hadoop中的MapReduce框架原理、Job提交流程源码断点在哪断并且介绍相关源码、切片与MapTask并行度决定机制、MapTask并行度决定机制

阿里云E-MapReduce团队

|

分布式计算 Hadoop 大数据

7月2日 JindoFS 系列直播【Hadoop 小文件/冷文件分析】

庞大的小文件和冷文件数量会对HDFS的性能产生不利影响，严重时甚至影响业务稳定性，这个主题将介绍对大容量HDFS进行小文件和冷文件分析的方法，并基于分析结果可以采取哪些处理措施。

阿里云E-MapReduce团队

834 0 0

7月2日 JindoFS 系列直播【Hadoop 小文件/冷文件分析】

阿里云E-MapReduce团队

|

SQL 存储分布式计算

3月5日JindoFS系列直播【Hadoop Job committer 的演化和发展】

Job Committer是Mapreduce/Spark等分布式计算框架的重要组成部分，为分布式任务的写入提供一致性的保证，本次分享主要介绍Job Committer的演进历史，以及社区和EMR在S3/OSS等云存储上的最新进展。

阿里云E-MapReduce团队

650 0 0

3月5日JindoFS系列直播【Hadoop Job committer 的演化和发展】

古明地盆

|

9天前

|

存储分布式计算资源调度

两万字长文向你解密大数据组件 Hadoop

两万字长文向你解密大数据组件 Hadoop

古明地盆

31 11 11

wljslmz

|

2月前

|

存储分布式计算 Hadoop

什么是 Hadoop？它如何解决大数据问题？

【8月更文挑战第12天】

wljslmz

160 4 4

什么是 Hadoop？它如何解决大数据问题？

大数据与机器学习

开源大数据平台 E-MapReduce

热门文章

最新文章

阿里封神谈hadoop生态学习之路

现代流式计算的基石：Google DataFlow

助力云上开源生态 - 阿里云开源大数据平台的发展

在 Apache Spark 中利用 HyperLogLog 函数实现高级分析

从数砖开源 Delta Lake 说起

Apache Spark 3.0 将内置支持 GPU 调度

使用Hive进行OSS数据处理的一个最佳实践

HAS-插件式Kerberos认证框架

开源生态的新发展：Apache Spark 3.0、Koala和Delta Lake

HBase写性能优化

从数据积累到大模型的智能飞跃，你准备好了吗？

DB-GPT v0.6.0 版本更新，发布六大核心新特性！

云栖实录 | 阿里云 OpenLake 解决方案重磅发布：多模态数据统一纳管、引擎平权联合计算、数据共享统一读写

阿里云 EMR Serverless Spark 版正式开启商业化

小红书 API 接口使用指南：笔记详情数据接口的接入与使用

阿里云 EMR StarRocks 在七猫的应用和实践

EMR Serverless StarRocks体验测评

EMR Serverless Spark 实践教程 | 通过 Apache Airflow 使用 Livy Operator 提交任务

不是吧？这么好用的开源标注工具，竟然还有人不知道…

迟来的EMR Serverless Spark评测报告

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

大数据实战项目 - 反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第六阶段

大数据Hadoop快速入门

Hadoop快速入门

Hadoop企业优化及扩展案例

相关电子书

更多

《构建Hadoop生态批流一体的实时数仓》

零基础实现hadoop 迁移 MaxCompute 之数据

CIO 指南:如何在SAP软件架构中使用Hadoop

相关实验场景

更多

基于Hologres+Flink搭建GitHub实时数据大屏

基于Flink+Tair搭建实时监控大屏

基于EMR Serverless StarRocks一键玩转世界杯

使用Flink实时发现最热Github项目

数据湖构建DLF快速入门

搭建Hadoop环境

下一篇

阿里云对象存储OSS怎么收费？包年包月和按量付费价格表