阿里云分布式存储Pangu团队招人啦

简介: 阿里云-飞天-盘古是阿里云自研的分布式存储平台,承接了整个阿里云的存储业务,拥有海量的用户。因业务需求增加,诚邀广大志同道合者加入。
+关注继续查看

阿里云-飞天-盘古

概述

业务

  • 盘古是阿里云自研的分布式存储平台,承接了整个阿里云的存储业务,拥有海量的用户。当前支持的业务方向主要有
    1. 超大规模的分布式文件系统(单集群数万台机器,数十亿文件),主要用于阿里云的大数据计算服务(ODPS)。
    2. 块存储,支持阿里云的云盘业务,包括全SSD云盘,混合存储云盘,SATA云盘,目前无论是收费用户数、营收、数据量、机器规模 在国内都无出其右。
    3. 对象存储,成功入围Gartner最新一期全球公共云存储服务魔力象限,也是首家入选的中国云服务商。
    4. 表格存储、SLS、归档服务、NAS、消息队列服务等大量的新业务均基于盘古存储平台。 目前所有这些业务均发展迅猛,无论是用户量,数据量,机器数,每年都是超过100%的增长,完全在风口上,而且随着云计算的深入发展,大量的企业上云,这个趋势还在不断增强。整个业务的国际化发展非常好,目前在美国、德国、日本、澳大利亚、新加坡、迪拜、印度、中国香港、中国台湾 等地均有部署和大量的国际客户。

团队

  • 大家都坚持用事实,用数据说话,沟通协作便捷高效。业务在飞速发展,有足够的丰腴土地待开发,所以基本上每个人都能独立own一块,并且能长期专注的深耕下去,个人能取得长足的发展,但并不为每个人设置硬的界限,崇尚志愿者文化,遇到挑战性的问题,欢迎任何人挺身而出来承担,大家协调资源帮他拿到结果,新人很容易脱颖而出。
  • 团队大牛多,有ACM世界冠军,中科院的研究员,7位博士。人员非常稳定,流失率低,超过一半的同事干了4年以上,对我们而言,这个不仅仅是一份工作,而是一个事业,我们信仰云计算。
  • 特别声明一下团队是有妹子的,已有三位,我们欢迎更多。
  • 当前我们正在进行下一代分布式存储平台的研发,计划做出革命性,大幅领先市场的产品,求贤若渴,热烈欢迎各路精英加盟。

工作环境

  • 对于用户,数据安全就是生命。存储是个高危行业,我们从不讳言承受着巨大压力,期待你有足够的抗压能力。
  • 不强制加班,但确有加班,我们更期待高效率的工作而不是加班,不搞996,工作时间弹性。
  • 工作地点 北京、杭州、上海,入职上海的同学前期需要到杭州熟悉业务。

岗位描述

  1. 下一代分布式存储系统的架构设计与实现,研发大幅领先市场的存储。

  2. 高可靠、高可用 系统的设计开发与演进,黑天鹅事件的规避预防以及损失控制,降低爆炸半径。数据是用户的生命,绝对不能错,不能丢,而且要高可用(发生不可用故障后,百倍赔偿),众所周知硬件都会发生故障,我们碰到过网卡错,CPU错,内存错,网络错,磁盘/raid卡出错是家常便饭,更不用说内核错了,太常见了,在这里你会碰到太多的险恶性问题(事前难以预料,只有发生了才会意识到的问题),我们的工作就是要在这些不可靠的软硬件环境下为用户提供高可靠,高可用的存储服务。

  3. 对接新的硬件(NVME, NVDIMM,3DXPOINT, RDMA网络),提升资源利用率,降低硬件成本,为用户提供更便宜的存储。当前公司的存储产品每年都大幅降价,让利于客户,这要求我们在软件层面更高效的用好硬件资源,为产品开创更大的让利空间。

  4. 用户对IO性能的追求永无止境,我们一直致力于降低IO latency, 提升吞吐量,其中涉及到网络性能优化,单机存储的性能优化,例如我们正在研发的用户态文件系统。你做的每1us的优化,都会惠及海量的用户。

  5. 关注工程质量,严格的代码review, UT/ST测试,每位开发者都要对自己的代码负责,你就是最后的守夜人。

  6. 倾听用户的声音,去伪存真,将其转化为合理的需求,制定开发计划,并推动上线。

岗位要求

  1. 热爱代码,追求高品质代码,对工程质量有深刻认识。积极主动,遇到不好的代码,鼓励每个人动手修正,不管是否你写的。

  2. 坚毅,有足够的耐力。云计算是一场长征,有太多的困难要克服,有太多的坑要趟,没有足够的耐力很难坚持下来,如今团队内已经有多个马拉松爱好者。

  3. 用数据说话,用数理逻辑服人,整个团队都用这种方式沟通,你会发现沟通会非常简洁高效。

  4. 将物理极限作为系统的极限,不轻言不可能,我们偏好追求极致的人。

  5. 思维活跃,能根据现状提出新的想法,对于和团队大方向一致的想法我们会尽力协调资源帮你实现这个想法。

  6. 我们主要使用C/C++ 来工作。

  7. 性格开朗,具有较强的组织能力,能活跃团队氛围,丰富团队生活,组织高质量团建的,是加分项。

  8. 熟悉分布式系统,有高可用系统经验,熟悉linux kernel , IO 虚拟化, SSD硬件,或者有存储背景, 是加分项。

  9. 自信,以上条件不能完全具备也没有关系,我们欢迎自信的人。

联系人:吴均平 邮箱: junping.wu@alibaba-inc.com

目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 并行计算
阿里云& NVIDIA TensorRT Hackathon 2023 决赛圆满收官,26支AI团队崭露头角
2023年9 月 29 日,由阿里云、NVIDIA 联合主办,阿里云天池平台承办的 “TensorRT Hackathon 2023 生成式 AI 模型优化赛” 圆满落幕。
119 0
|
3月前
|
存储 弹性计算 运维
如何从用户视角搭建可观测体系?阿里云ECS业务团队的设计思路
本文以阿里云ECS业务为例,探讨阿里云最核心、亚太地区业务规模最大的产品之一,在极高的稳定性和性能要求下,如何基于云构建可观测性并从客户视角建立观测能力,以及在推进体系建设中的成功经验和待改进之处。
如何从用户视角搭建可观测体系?阿里云ECS业务团队的设计思路
|
4月前
|
存储 Cloud Native 测试技术
阿里云块存储团队软件工程实践
这是阿里云块存储团队内部的一次新人培训材料,内容源自老同学们的踩坑经验,总结成案例和方法分享公示,实践和方法论不限于分布式系统,希望对读者有启发。本文主要包括以下三个方面:  ●编码习惯(开发、测试、Review,Bad/Good Case) ●研发流程(源码控制、每日构建、缺陷管理) ●实践方法(效率工具、新人踩雷、学习推荐)
25005 10
|
6月前
|
弹性计算 缓存 人工智能
阿里云李钟:弹性计算控制系统团队提效之路
2023年3月25日,“城市领航之夜 第一期”活动在上海举行,阿里云弹性计算控制系统技术架构负责人李钟出席了本次活动并带来了《弹性计算控制系统团队提效之路》的主题演讲,为大家详细分享了阿里云弹性计算控制系统团队所面临的挑战、如何通过技术架构提效,以及工程师文化建设等一系列内容。
|
8月前
|
人工智能 弹性计算 编解码
GTC 2023 | 阿里云弹性计算团队专家演讲推荐
了解云上弹性磅礴算力背后的关键技术
GTC 2023 | 阿里云弹性计算团队专家演讲推荐
|
9月前
|
消息中间件 Cloud Native Devops
阿里云云原生团队全新力作《云原生消息队列 Apache RocketMQ》重磅来袭
消息服务作为应用的通信基础设施,是微服务架构应用的核心依赖,也是实践云原生的核心设计理念的关键技术,通过消息服务能够让用户很容易架构出分布式的、高性能的、弹性的应用程序。消息服务在云原生的重要性也导致其极可能成为应用实践云原生的阻塞点,所以消息服务的云原生化是至关重要的。
1223 0
 阿里云云原生团队全新力作《云原生消息队列 Apache RocketMQ》重磅来袭
|
11月前
|
机器学习/深度学习 人工智能 编解码
PAI-Diffusion 模型来了!阿里云机器学习团队带您徜徉中文艺术海洋
PAI-Diffusion系列模型,包括一系列通用场景和特定场景的文图生成模型,本⽂简要介绍PAI-Diffusion模型及其体验方式。
|
存储 Cloud Native 测试技术
阿里云块存储团队软件工程实践【对外版】
作者:晴筱、石超、张小路序“我背上有个背篓,里面装了很多血泪换来的经验教训,我看着你们在台下嗷嗷待哺想要这个背篓里的东西,但事实上我给不了你们”,实践出真知。 这是阿里云块存储团队内部的一次新人培训材料,内容源自老同学们的踩坑经验,总结成案例和方法分享公示,实践和方法论不限于分布式系统,希望对读者有启发。本文主要包括以下三个方面:编码习惯(开发、测试、Review,Bad/Good Case)研发
770 5
阿里云块存储团队软件工程实践【对外版】
|
Kubernetes Cloud Native 测试技术
阿里云块存储团队软件工程实践
“我背上有个背篓,里面装了很多血泪换来的经验教训,我看着你们在台下嗷嗷待哺想要这个背篓里的东西,但事实上我给不了你们”,实践出真知。
阿里云块存储团队软件工程实践
|
数据采集 机器学习/深度学习 算法
多点开花:阿里云基础设施光网络团队论道OFC 2022
OFC 2022进行时,阿里云基础设施光网络团队论道、分享~
多点开花:阿里云基础设施光网络团队论道OFC 2022
热门文章
最新文章
推荐文章
更多