阿里云 DataLakeAnalytics 团队招人啦!

简介:

团队介绍

我们是阿里巴巴集团数据库事业部的OLAP 平台团队,我们专注于提供全球领先的全栈式大规模OLAP产品,目前在阿里集团、公共云、专有云提供了分析型数据库AnalyticDB、时间序列数据库HiTSDB, 数据湖分析引擎: DataLakeAnalytics 等多个产品,得到了大规模应用。每天数据写入记录数在万亿级,查询请求十亿级。

岗位描述

Data Lake Analytics团队,如果你追求技术,你是幸运的,因为在这里,你接触的面很广,云计算的各层技术,从IaaS、PaaS、DBasS、SaaS到FaaS,从网络、存储、计算到虚拟化,或用、或优化、或设计、或开发,你不会out!数据库的多个方面,从JDBC protocol、SQL parser、optimizer、MPP runtime execution到meta store等等,你迟早都会碰到!此外,还有机会和炫酷的硬件加速团队合作推进极致性价比的硬件加速技术实施与落地。在这里你会接触到以下方面的工作:

  • 负责面向多数据源的大规模计算引擎平台的设计、开发;
  • 提升平台资源利用率和性能;
  • 负责基础技术的积累、前沿技术、业界标准规范研究和落地
  • 系统性能调优,精简硬件资源需求,例如降低计算开销,提高响应QPS等;
  • 研究与合作硬件加速技术在多数据源计算平台的技术落地。

岗位要求:

  • 有4年以上分布式计算框架的开发、优化经验并在生产环境得到大规模应用;
  • 对Hadoop ecosystem、Spark ecosystem、Presto ecosystem、Flink ecosystem以及类似分布式系统中的至少一个有深入研究;
  • 精通JAVA或者C/C++,有linux下丰富的应用性能诊断和优化经验;
  • 有强烈的上进心和求知欲,善于学习新事物,对技术充满激情 ;
  • 具有较强的团队合作能力,勇于面对和解决挑战性问题。

优先考虑:

  • 数据库内核开发或机器学习平台开发背景;
  • 有开源社区贡献者优先,Hadoop/Hive/Hbase/Spark/Beam/Yarn 源码熟悉;
  • linux内核经验 、JVM经验;
  • 有Cloud native、Serverless、DevOps等云上技术实施和项目开发经验

欢迎发送简历到 mingming.xumm at alibaba-inc.com, 来信必复。

相关实践学习
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
目录
相关文章
|
11月前
|
存储 运维 网络协议
【Syslog】Centos下的syslog服务器配置
通过本文的配置指导,您不仅学会了如何安装和配置 `rsyslog`,还掌握了如何在防火墙中开放必要的端口,并验证服务器的配置是否正确。希望这些知识能够帮助您更好地管理和维护您的Linux系统。
2182 15
|
机器学习/深度学习 人工智能 自然语言处理
【人工智能】Foxmail邮箱在人工智能领域的应用方法及代码解析
Foxmail邮箱作为一款流行的邮件客户端软件,主要用于个人和企业的邮件收发、管理等功能。虽然它与人工智能(AI)技术有着潜在的融合点,但直接关于Foxmail邮箱在人工智能方面的应用代码并不是常规的讨论内容,因为邮箱客户端本身并不直接包含复杂的AI算法或代码。
1088 58
|
12月前
|
JSON 安全 API
亚马逊商品详情API接口的使用方法和示例返回
亚马逊商品详情API接口是亚马逊为开发者提供的一个重要工具,它允许开发者通过编程方式获取亚马逊平台上的商品详细信息。以下是该接口的使用方法和示例返回的简要说明
|
监控 Serverless 云计算
探索Serverless架构:开发的未来趋势
【10月更文挑战第5天】Serverless架构,即无服务器架构,正逐渐成为云计算领域的热点。它允许开发者构建和运行应用程序而无需管理底层服务器。本文介绍了Serverless架构的基本概念、核心优势及挑战,并展示了其在事件驱动编程、微服务架构和数据流处理等场景中的应用。通过优化冷启动、使用外部存储等实战技巧,开发者可以更好地利用Serverless架构提升开发效率和应用性能。随着技术的成熟,Serverless将在未来软件开发中扮演重要角色。
|
JavaScript 前端开发
什么是 for 循环?
什么是 for 循环?
419 0
|
弹性计算 负载均衡 算法
负载均衡调度算法介绍
介绍负载均衡调度算法
528 8
|
传感器 存储 安全
机器通信 | 《5G移动无线通信技术》之八
本节主要介绍了机器通信的内容以及超可靠机器类通信。
机器通信  | 《5G移动无线通信技术》之八
|
消息中间件 监控 负载均衡
Kafka 最佳实践:构建可靠、高性能的分布式消息系统
Apache Kafka 是一个强大的分布式消息系统,被广泛应用于实时数据流处理和事件驱动架构。为了充分发挥 Kafka 的优势,需要遵循一些最佳实践,确保系统在高负载下稳定运行,数据可靠传递。本文将深入探讨 Kafka 的一些最佳实践,并提供丰富的示例代码,帮助大家更好地应用这一强大的消息系统。
|
存储 Linux C语言
Linux获取文件信息的利器stat,fstat,lstat,fstatat
stat系列函数是C语言中的一个系统调用函数,用于获取文件的信息。通过提供文件路径,它能够返回包含文件属性的结构体数据。
644 0
|
XML 存储 数据处理
1.基于Label studio的训练数据标注指南:信息抽取(实体关系抽取)、文本分类等
1.基于Label studio的训练数据标注指南:信息抽取(实体关系抽取)、文本分类等
1.基于Label studio的训练数据标注指南:信息抽取(实体关系抽取)、文本分类等