阿里云智能事业群 EMR团队招人啦!

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 加入我们,成为分布式存储,计算和调度等领域的专家,与众多业界和社区技术专家一起工作,加速大数据上云,投身数字时代新基建。

团队介绍

阿里云智能事业群 EMR 是阿里巴巴计算平台事业部的开源大数据生态体系核心技术团队。我们以 Apache Hadoop 和 Spark为核心打造一站式大数据分析平台,在阿里云上提供有竞争力的 E-MapReduce大数据上云服务产品套件,涵盖众多主流核心开源组件,如 Hadoop,Spark,Hive,Presto,Kafka,Hbase,Flink,Tensorflow 等。在过去一年,基于最新打造的 Jindo Spark 核心引擎,E-MapReduce 产品先后两次打破 TPC-DS 世界记录。我们的技术团队不仅包括阿里飞天大数据资深优化专家,同时围绕开源技术体系构建,包括来自Apache Hadoop/Spark/Flink/Hive 等顶级开源项目的多位PMC/Committer成员。我们热烈欢迎有志于开源技术体系核心引擎研发和优化的同学加入 EMR团队,与众多业界和社区技术专家一起工作,加速大数据上云,投身数字时代新基建。

职位描述

•基于Hadoop、Spark、Hive、HBase、Flink,Kafka,TensorFlow等开源大数据组件,构建云原生大数据平台,提供大规模计算能力

•以 Apache Spark 为核心,深度结合阿里云对象存储和弹性计算能力,打造云上开源大数据核心引擎

•使用最新的大数据和AI技术,打造智能化的数据分析和机器学习平台

•打造世界顶级的开源大数据平台,在公共云、裸机、私有云和混合云等环境, 为阿里云客户提供云原生大数据全家桶服务

•参与阿里云城市大脑、智慧交通等多项国家战略项目建设,利用实时/批技术处理真实世界中的海量数据

校招/实习职位要求

1.计算机、通信、数学等相关专业,具备良好的计算机技术基础

2.熟悉Java/C++/Python/GO等至少一种编程语言,具备扎实的数据结构和算法基础

3.具备良好的沟通和团队协作能力,做事主动积极,有技术热情和激情面对挑战

4.对大规模分布式存储,计算和调度有较好基础理论研究的同学优先

5.熟悉Hadoop/Spark/Hive/Flink/HBase/Kafka/TensorFlow/Kubernetes 技术者优先

欢迎投递简历到邮箱:zhengkai.zk@alibaba-inc.com,投递时请写明工作地(北京/杭州/上海)

社招职位要求

•在分布式存储,计算和调度等领域有多年工作经验和较深技术积累;

•源码层面熟悉一个或多个开源组件,包括Hadoop,Spark,Flink,Hbase,Hive,Kafka,TensorFlow,Kubernetes;

•具备良好的沟通和团队协作能力,做事主动积极,有技术热情和激情面对挑战;

欢迎投递简历到邮箱:zhengkai.zk@alibaba-inc.com,投递时请写明工作地(北京/杭州/上海)

校招海报-计算平台2020.png

相关实践学习
基于EMR Serverless StarRocks一键玩转世界杯
基于StarRocks构建极速统一OLAP平台
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
6天前
|
机器学习/深度学习 分布式计算 大数据
阿里云 EMR Serverless Spark 在微财机器学习场景下的应用
面对机器学习场景下的训练瓶颈,微财选择基于阿里云 EMR Serverless Spark 建立数据平台。通过 EMR Serverless Spark,微财突破了单机训练使用的数据规模瓶颈,大幅提升了训练效率,解决了存算分离架构下 Shuffle 稳定性和性能困扰,为智能风控等业务提供了强有力的技术支撑。
|
1月前
|
SQL 弹性计算 分布式计算
阿里云 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%
阿里云开源大数据平台 E-MapReduce 重磅推出托管弹性伸缩功能,基于 EMR 托管弹性伸缩功能,您可以指定集群的最小和最大计算限制,EMR 会持续对与集群上运行的工作负载相关的关键指标进行采样,自动调整集群大小,以获得最佳性能和资源利用率。
122 15
|
4月前
|
SQL 存储 缓存
阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse
本文介绍了阿里云EMR StarRocks在数据湖分析领域的应用,涵盖StarRocks的数据湖能力、如何构建基于Paimon的实时湖仓、StarRocks与Paimon的最新进展及未来规划。文章强调了StarRocks在极速统一、简单易用方面的优势,以及在数据湖分析加速、湖仓分层建模、冷热融合及全链路ETL等场景的应用。
368 8
阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse
|
4月前
|
SQL 存储 缓存
降本60% ,阿里云 EMR StarRocks 全新发布存算分离版本
阿里云 EMR Serverless StarRocks 现已推出全新存算分离版本,该版本不仅基于开源 StarRocks 进行了全面优化,实现了存储与计算解耦架构,还在性能、弹性伸缩以及多计算组隔离能力方面取得了显著进展。
495 6
|
4月前
|
SQL 存储 缓存
阿里云EMR StarRocks X Paimon创建 Streaming Lakehouse
讲师焦明烨介绍了StarRocks的数据湖能力,如何使用阿里云EMR StarRocks构建基于Paimon的极速实时湖仓,StarRocks与Paimon的最新进展及未来规划。
191 3
|
5月前
|
SQL 分布式计算 Serverless
阿里云 EMR Serverless Spark 版正式开启商业化
阿里云 EMR Serverless Spark 版正式开启商业化,内置 Fusion Engine,100% 兼容开源 Spark 编程接口,相比于开源 Spark 性能提升300%;提供 Notebook 及 SQL 开发、调试、发布、调度、监控诊断等一站式数据开发体验!
224 3
阿里云 EMR Serverless Spark 版正式开启商业化
|
5月前
|
SQL 存储 NoSQL
阿里云 EMR StarRocks 在七猫的应用和实践
本文整理自七猫资深大数据架构师蒋乾老师在 《阿里云 x StarRocks:极速湖仓第二季—上海站》的分享。
364 2
|
6月前
|
存储 分布式计算 大数据
大数据革新在即,阿里云EMR如何布局DeltaLake引领行业潮流?
【8月更文挑战第26天】大数据时代,实时处理与分析能力对企业至关重要。Delta Lake 作为高性能、可靠且支持 ACID 事务的开源存储层,已成为业界焦点。阿里云 EMR 深度布局 Delta Lake,计划深化集成、强化数据安全、优化实时性能,并加强生态建设与社区贡献。通过与 Spark 的无缝对接及持续的技术创新,阿里云 EMR 致力于提供更高效、安全的数据湖解决方案,引领大数据处理领域的发展新方向。
70 3
|
6月前
|
安全 数据管理 大数据
数据湖的未来已来:EMR DeltaLake携手阿里云DLF,重塑企业级数据处理格局
【8月更文挑战第26天】在大数据处理领域,阿里云EMR与DeltaLake的集成增强了数据处理能力。进一步结合阿里云DLF服务,实现了数据湖的一站式管理,自动化处理元数据及权限控制,简化管理流程。集成后的方案提升了数据安全性、可靠性和性能优化水平,让用户更专注业务价值。这一集成标志着数据湖技术向着自动化、安全和高效的未来迈出重要一步。
131 2
|
6月前
|
存储 分布式计算 大数据
阿里云 EMR 强势助力,与阿里云大数据体系共创辉煌,把握时代热点,开启生态建设之旅
【8月更文挑战第26天】阿里云EMR(Elastic MapReduce)是一种大数据处理服务,与阿里云的多个服务紧密结合,共同构建了完善的大数据生态系统。EMR与对象存储服务(OSS)集成,利用OSS提供可靠、低成本且可扩展的数据存储;与MaxCompute集成,实现深度数据分析和挖掘;还支持数据湖构建服务,加速数据湖的搭建并简化数据管理与分析过程。EMR提供多种编程接口及工具,如Hive、Spark和Flink等,帮助用户高效完成大数据处理任务。
180 2