阿里云分布式存储Pangu团队招人啦

简介: 阿里云-飞天-盘古是阿里云自研的分布式存储平台,承接了整个阿里云的存储业务,拥有海量的用户。因业务需求增加,诚邀广大志同道合者加入。

阿里云-飞天-盘古

概述

业务

  • 盘古是阿里云自研的分布式存储平台,承接了整个阿里云的存储业务,拥有海量的用户。当前支持的业务方向主要有
    1. 超大规模的分布式文件系统(单集群数万台机器,数十亿文件),主要用于阿里云的大数据计算服务(ODPS)。
    2. 块存储,支持阿里云的云盘业务,包括全SSD云盘,混合存储云盘,SATA云盘,目前无论是收费用户数、营收、数据量、机器规模 在国内都无出其右。
    3. 对象存储,成功入围Gartner最新一期全球公共云存储服务魔力象限,也是首家入选的中国云服务商。
    4. 表格存储、SLS、归档服务、NAS、消息队列服务等大量的新业务均基于盘古存储平台。 目前所有这些业务均发展迅猛,无论是用户量,数据量,机器数,每年都是超过100%的增长,完全在风口上,而且随着云计算的深入发展,大量的企业上云,这个趋势还在不断增强。整个业务的国际化发展非常好,目前在美国、德国、日本、澳大利亚、新加坡、迪拜、印度、中国香港、中国台湾 等地均有部署和大量的国际客户。

团队

  • 大家都坚持用事实,用数据说话,沟通协作便捷高效。业务在飞速发展,有足够的丰腴土地待开发,所以基本上每个人都能独立own一块,并且能长期专注的深耕下去,个人能取得长足的发展,但并不为每个人设置硬的界限,崇尚志愿者文化,遇到挑战性的问题,欢迎任何人挺身而出来承担,大家协调资源帮他拿到结果,新人很容易脱颖而出。
  • 团队大牛多,有ACM世界冠军,中科院的研究员,7位博士。人员非常稳定,流失率低,超过一半的同事干了4年以上,对我们而言,这个不仅仅是一份工作,而是一个事业,我们信仰云计算。
  • 特别声明一下团队是有妹子的,已有三位,我们欢迎更多。
  • 当前我们正在进行下一代分布式存储平台的研发,计划做出革命性,大幅领先市场的产品,求贤若渴,热烈欢迎各路精英加盟。

工作环境

  • 对于用户,数据安全就是生命。存储是个高危行业,我们从不讳言承受着巨大压力,期待你有足够的抗压能力。
  • 不强制加班,但确有加班,我们更期待高效率的工作而不是加班,不搞996,工作时间弹性。
  • 工作地点 北京、杭州、上海,入职上海的同学前期需要到杭州熟悉业务。

岗位描述

  1. 下一代分布式存储系统的架构设计与实现,研发大幅领先市场的存储。

  2. 高可靠、高可用 系统的设计开发与演进,黑天鹅事件的规避预防以及损失控制,降低爆炸半径。数据是用户的生命,绝对不能错,不能丢,而且要高可用(发生不可用故障后,百倍赔偿),众所周知硬件都会发生故障,我们碰到过网卡错,CPU错,内存错,网络错,磁盘/raid卡出错是家常便饭,更不用说内核错了,太常见了,在这里你会碰到太多的险恶性问题(事前难以预料,只有发生了才会意识到的问题),我们的工作就是要在这些不可靠的软硬件环境下为用户提供高可靠,高可用的存储服务。

  3. 对接新的硬件(NVME, NVDIMM,3DXPOINT, RDMA网络),提升资源利用率,降低硬件成本,为用户提供更便宜的存储。当前公司的存储产品每年都大幅降价,让利于客户,这要求我们在软件层面更高效的用好硬件资源,为产品开创更大的让利空间。

  4. 用户对IO性能的追求永无止境,我们一直致力于降低IO latency, 提升吞吐量,其中涉及到网络性能优化,单机存储的性能优化,例如我们正在研发的用户态文件系统。你做的每1us的优化,都会惠及海量的用户。

  5. 关注工程质量,严格的代码review, UT/ST测试,每位开发者都要对自己的代码负责,你就是最后的守夜人。

  6. 倾听用户的声音,去伪存真,将其转化为合理的需求,制定开发计划,并推动上线。

岗位要求

  1. 热爱代码,追求高品质代码,对工程质量有深刻认识。积极主动,遇到不好的代码,鼓励每个人动手修正,不管是否你写的。

  2. 坚毅,有足够的耐力。云计算是一场长征,有太多的困难要克服,有太多的坑要趟,没有足够的耐力很难坚持下来,如今团队内已经有多个马拉松爱好者。

  3. 用数据说话,用数理逻辑服人,整个团队都用这种方式沟通,你会发现沟通会非常简洁高效。

  4. 将物理极限作为系统的极限,不轻言不可能,我们偏好追求极致的人。

  5. 思维活跃,能根据现状提出新的想法,对于和团队大方向一致的想法我们会尽力协调资源帮你实现这个想法。

  6. 我们主要使用C/C++ 来工作。

  7. 性格开朗,具有较强的组织能力,能活跃团队氛围,丰富团队生活,组织高质量团建的,是加分项。

  8. 熟悉分布式系统,有高可用系统经验,熟悉linux kernel , IO 虚拟化, SSD硬件,或者有存储背景, 是加分项。

  9. 自信,以上条件不能完全具备也没有关系,我们欢迎自信的人。

联系人:吴均平 邮箱: junping.wu@alibaba-inc.com

目录
相关文章
|
11天前
|
存储 人工智能 安全
阿里云网盘与相册服务(简称PDS)是阿里云为客户提供的面向企业、团队与个人的数据管理开放平台
阿里云网盘与相册服务(简称PDS)是阿里云为客户提供的面向企业、团队与个人的数据管理开放平台
113 1
|
3天前
|
人工智能 监控 开发者
阿里云PAI发布DeepRec Extension,打造稳定高效的分布式训练,并宣布开源!
阿里云人工智能平台PAI正式发布自研的 DeepRec Extension(即 DeepRec 扩展),旨在以更低成本,更高效率进行稀疏模型的分布式训练。
|
5天前
|
Cloud Native 数据管理 关系型数据库
【阿里云云原生专栏】云原生数据管理:阿里云数据库服务的分布式实践
【5月更文挑战第21天】阿里云数据库服务在云原生时代展现优势,应对分布式数据管理挑战。PolarDB等服务保证高可用和弹性,通过多副本机制和分布式事务确保数据一致性和可靠性。示例代码展示了在阿里云数据库上进行分布式事务操作。此外,丰富的监控工具协助用户管理数据库性能,支持企业的数字化转型和业务增长。
174 1
|
11天前
|
Cloud Native Java 开发工具
云原生 阿里云分布式文件系统 对象存储OSS 服务配置
【1月更文挑战第8天】云原生 阿里云分布式文件系统 对象存储OSS 服务配置
|
11天前
|
测试技术 块存储 开发者
阿里云块存储团队软件工程实践
本文介绍了阿里云团队软件工程实际开发流程,并简述了开发过程中遇到的一些问题。且附带案例,以及遇到案例中出现的情况应当如何应对。
|
11天前
|
域名解析 负载均衡 网络协议
阿里云基础设施网络研发团队参与论文获得CCS 2023 杰出论文奖
阿里云基础设施网络研发团队参与论文获得CCS 2023 杰出论文奖
|
11天前
|
Cloud Native Java 关系型数据库
阿里云 PolarDB-X 团队25届实习生招聘
阿里云 PolarDB-X 团队25届实习生招聘
|
11天前
|
存储 Kubernetes 监控
阿里云分布式云容器平台
阿里云分布式云容器平台(ACK One)是一款面向混合云、多集群、分布式计算、容灾等场景推出的企业级云原生平台。它支持连接并管理任何地域、任何基础设施上的Kubernetes集群,提供一致的管理和社区兼容的API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。
61 4
|
11天前
|
人工智能 Cloud Native PyTorch
阿里云 ACK 云原生 AI 套件中的分布式弹性训练实践
阿里云 ACK 云原生 AI 套件中的分布式弹性训练实践
148675 4
|
11天前
|
关系型数据库 分布式数据库 数据库
参加数据库PolarDB分布式版训练营,完成任务即可领取阿里云新年礼盒等大礼包!
本训练营将带你了解PolarDB分布式版(PolarDB-X)是如何诞生的?技术架构又是怎样的?PolarDB-X 的核心技术有哪些? 带你学习PolarDB-X的6大典型适用场景,包括金融级可靠性、透明水平扩展、替换开源分库分表、HTAP 混合负载等,以及基于PolarDB-X的一些应用设计和最佳实践。

热门文章

最新文章