大数据和机器学习 > 开源大数据平台 E-MapReduce > 正文

阿里云智能事业群 EMR团队招人啦!

简介: 加入我们,成为分布式存储,计算和调度等领域的专家,与众多业界和社区技术专家一起工作,加速大数据上云,投身数字时代新基建。
+关注继续查看

团队介绍

阿里云智能事业群 EMR 是阿里巴巴计算平台事业部的开源大数据生态体系核心技术团队。我们以 Apache Hadoop 和 Spark为核心打造一站式大数据分析平台,在阿里云上提供有竞争力的 E-MapReduce大数据上云服务产品套件,涵盖众多主流核心开源组件,如 Hadoop,Spark,Hive,Presto,Kafka,Hbase,Flink,Tensorflow 等。在过去一年,基于最新打造的 Jindo Spark 核心引擎,E-MapReduce 产品先后两次打破 TPC-DS 世界记录。我们的技术团队不仅包括阿里飞天大数据资深优化专家,同时围绕开源技术体系构建,包括来自Apache Hadoop/Spark/Flink/Hive 等顶级开源项目的多位PMC/Committer成员。我们热烈欢迎有志于开源技术体系核心引擎研发和优化的同学加入 EMR团队,与众多业界和社区技术专家一起工作,加速大数据上云,投身数字时代新基建。

职位描述

•基于Hadoop、Spark、Hive、HBase、Flink,Kafka,TensorFlow等开源大数据组件,构建云原生大数据平台,提供大规模计算能力

•以 Apache Spark 为核心,深度结合阿里云对象存储和弹性计算能力,打造云上开源大数据核心引擎

•使用最新的大数据和AI技术,打造智能化的数据分析和机器学习平台

•打造世界顶级的开源大数据平台,在公共云、裸机、私有云和混合云等环境, 为阿里云客户提供云原生大数据全家桶服务

•参与阿里云城市大脑、智慧交通等多项国家战略项目建设,利用实时/批技术处理真实世界中的海量数据

校招/实习职位要求

1.计算机、通信、数学等相关专业,具备良好的计算机技术基础

2.熟悉Java/C++/Python/GO等至少一种编程语言,具备扎实的数据结构和算法基础

3.具备良好的沟通和团队协作能力,做事主动积极,有技术热情和激情面对挑战

4.对大规模分布式存储,计算和调度有较好基础理论研究的同学优先

5.熟悉Hadoop/Spark/Hive/Flink/HBase/Kafka/TensorFlow/Kubernetes 技术者优先

欢迎投递简历到邮箱:zhengkai.zk@alibaba-inc.com,投递时请写明工作地(北京/杭州/上海)

社招职位要求

•在分布式存储,计算和调度等领域有多年工作经验和较深技术积累;

•源码层面熟悉一个或多个开源组件,包括Hadoop,Spark,Flink,Hbase,Hive,Kafka,TensorFlow,Kubernetes;

•具备良好的沟通和团队协作能力,做事主动积极,有技术热情和激情面对挑战;

欢迎投递简历到邮箱:zhengkai.zk@alibaba-inc.com,投递时请写明工作地(北京/杭州/上海)

校招海报-计算平台2020.png

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
水滴筹基于阿里云 EMR StarRocks 实战分享
水滴筹大数据部门的数据开发工程师韩园园老师为大家分享水滴筹基于阿里云EMR StarRocks的实战经验。
4782 0
免费公测|阿里云EMR Serverless StarRocks 公测正式开启!
阿里云EMR Serverless StarRocks 免费公测已开启,向所有用户开放!您可通过EMR控制台直接创建实例,轻松体验全托管、免运维的服务。
1521 0
阿里云EMR自定义日志投递与使用实践分享
EMR目前支持了日志管理,即日志客户SLS投递的功能,基于此功能,客户可以将需要的各种大数据组件日志收集到自身SLS中,做查询和分析。基于此功能,客户可以自定义日志路径、规则,对集群设备上的日志自行接收和消费。本文以采集指标文件为例,帮助您快速上手自定义日志投递与使用。
156 0
基于阿里云 CloudMonitor云监控自定义监控大盘对 EMR 自定义监控实践
本文旨在分享 EMR 平台大数据服务基于阿里云 CloudMonitor 的监控实践,给客户提供除了 EMR 平台默认监控以外,自建监控方式,适用于统一多个阿里云服务的监控监控场景。
244 0
阿里云EMR 2.0:定义下一代云原生智能数据湖
本次分享主要介绍了阿里云云原生数据湖分析解决方案的三个核心要素:全托管,湖存储;一站式,湖管理;多模态,湖计算。
29109 0
阿里云 EMR 基于 Apache DolphinScheduler 产品技术实践和社区贡献
本文整理自阿里云 EMR 数据开发团队负责人孙一凡(Evans 忆梵),在 Apache Spark & DS Meetup 的分享
321 0
阿里云EMR 2.0:兼容开源,贡献开源,超越开源
本文整理自阿里云资深技术专家吴威(无谓)在 阿里云EMR2.0线上发布会 的分享。本文从开源的角度出发,分享了阿里云EMR团队的工作。
481 0
StarRocks 2.5 LTS 版本新特性介绍及阿里云EMR Serverless StarRocks火热邀测中
StarRocks 2.5 LTS 版本于近期发布,阿里云EMR Serverless StarRocks也在火热邀测中。本文将重点介绍StarRocks 2.5版本核心功能以及阿里云EMR Serverless StarRocks特性。
393 0
阿里云EMR 2.0:重新定义新一代开源大数据平台
本次分享主要介绍了阿里云E-MapReduce的开发历程,EMR 2.0的新特性、产品架构,以及EMR 2.0在平台体验、数据开发、资源形态及分析场景等方面的全面突破与创新,重新定义新一代开源大数据平台。
1053 0
阿里云开源大数据平台EMR全面升级 性能最高可提升6倍
12月27日,阿里云正式发布云原生开源大数据平台EMR 2.0,升级后的开源大数据平台在成本持平的情况下,扩缩容性能最高可提升6倍。
436 0
阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。
+关注
开源大数据EMR
文章
问答
视频
相关电子书
更多
阿里云认证的解析与实战-数据仓库ACP认证
立即下载
低代码开发师(初级)实战教程
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载