阿里云分布式存储Pangu团队招人啦

简介: 阿里云-飞天-盘古是阿里云自研的分布式存储平台,承接了整个阿里云的存储业务,拥有海量的用户。因业务需求增加,诚邀广大志同道合者加入。

阿里云-飞天-盘古

概述

业务

  • 盘古是阿里云自研的分布式存储平台,承接了整个阿里云的存储业务,拥有海量的用户。当前支持的业务方向主要有
    1. 超大规模的分布式文件系统(单集群数万台机器,数十亿文件),主要用于阿里云的大数据计算服务(ODPS)。
    2. 块存储,支持阿里云的云盘业务,包括全SSD云盘,混合存储云盘,SATA云盘,目前无论是收费用户数、营收、数据量、机器规模 在国内都无出其右。
    3. 对象存储,成功入围Gartner最新一期全球公共云存储服务魔力象限,也是首家入选的中国云服务商。
    4. 表格存储、SLS、归档服务、NAS、消息队列服务等大量的新业务均基于盘古存储平台。 目前所有这些业务均发展迅猛,无论是用户量,数据量,机器数,每年都是超过100%的增长,完全在风口上,而且随着云计算的深入发展,大量的企业上云,这个趋势还在不断增强。整个业务的国际化发展非常好,目前在美国、德国、日本、澳大利亚、新加坡、迪拜、印度、中国香港、中国台湾 等地均有部署和大量的国际客户。

团队

  • 大家都坚持用事实,用数据说话,沟通协作便捷高效。业务在飞速发展,有足够的丰腴土地待开发,所以基本上每个人都能独立own一块,并且能长期专注的深耕下去,个人能取得长足的发展,但并不为每个人设置硬的界限,崇尚志愿者文化,遇到挑战性的问题,欢迎任何人挺身而出来承担,大家协调资源帮他拿到结果,新人很容易脱颖而出。
  • 团队大牛多,有ACM世界冠军,中科院的研究员,7位博士。人员非常稳定,流失率低,超过一半的同事干了4年以上,对我们而言,这个不仅仅是一份工作,而是一个事业,我们信仰云计算。
  • 特别声明一下团队是有妹子的,已有三位,我们欢迎更多。
  • 当前我们正在进行下一代分布式存储平台的研发,计划做出革命性,大幅领先市场的产品,求贤若渴,热烈欢迎各路精英加盟。

工作环境

  • 对于用户,数据安全就是生命。存储是个高危行业,我们从不讳言承受着巨大压力,期待你有足够的抗压能力。
  • 不强制加班,但确有加班,我们更期待高效率的工作而不是加班,不搞996,工作时间弹性。
  • 工作地点 北京、杭州、上海,入职上海的同学前期需要到杭州熟悉业务。

岗位描述

  1. 下一代分布式存储系统的架构设计与实现,研发大幅领先市场的存储。

  2. 高可靠、高可用 系统的设计开发与演进,黑天鹅事件的规避预防以及损失控制,降低爆炸半径。数据是用户的生命,绝对不能错,不能丢,而且要高可用(发生不可用故障后,百倍赔偿),众所周知硬件都会发生故障,我们碰到过网卡错,CPU错,内存错,网络错,磁盘/raid卡出错是家常便饭,更不用说内核错了,太常见了,在这里你会碰到太多的险恶性问题(事前难以预料,只有发生了才会意识到的问题),我们的工作就是要在这些不可靠的软硬件环境下为用户提供高可靠,高可用的存储服务。

  3. 对接新的硬件(NVME, NVDIMM,3DXPOINT, RDMA网络),提升资源利用率,降低硬件成本,为用户提供更便宜的存储。当前公司的存储产品每年都大幅降价,让利于客户,这要求我们在软件层面更高效的用好硬件资源,为产品开创更大的让利空间。

  4. 用户对IO性能的追求永无止境,我们一直致力于降低IO latency, 提升吞吐量,其中涉及到网络性能优化,单机存储的性能优化,例如我们正在研发的用户态文件系统。你做的每1us的优化,都会惠及海量的用户。

  5. 关注工程质量,严格的代码review, UT/ST测试,每位开发者都要对自己的代码负责,你就是最后的守夜人。

  6. 倾听用户的声音,去伪存真,将其转化为合理的需求,制定开发计划,并推动上线。

岗位要求

  1. 热爱代码,追求高品质代码,对工程质量有深刻认识。积极主动,遇到不好的代码,鼓励每个人动手修正,不管是否你写的。

  2. 坚毅,有足够的耐力。云计算是一场长征,有太多的困难要克服,有太多的坑要趟,没有足够的耐力很难坚持下来,如今团队内已经有多个马拉松爱好者。

  3. 用数据说话,用数理逻辑服人,整个团队都用这种方式沟通,你会发现沟通会非常简洁高效。

  4. 将物理极限作为系统的极限,不轻言不可能,我们偏好追求极致的人。

  5. 思维活跃,能根据现状提出新的想法,对于和团队大方向一致的想法我们会尽力协调资源帮你实现这个想法。

  6. 我们主要使用C/C++ 来工作。

  7. 性格开朗,具有较强的组织能力,能活跃团队氛围,丰富团队生活,组织高质量团建的,是加分项。

  8. 熟悉分布式系统,有高可用系统经验,熟悉linux kernel , IO 虚拟化, SSD硬件,或者有存储背景, 是加分项。

  9. 自信,以上条件不能完全具备也没有关系,我们欢迎自信的人。

联系人:吴均平 邮箱: junping.wu@alibaba-inc.com

目录
相关文章
|
22小时前
|
敏捷开发 测试技术 持续交付
阿里云云效产品使用合集之需要在某个企业或团队的云效实例中进行协作,该如何操作?
摘要:云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
2天前
|
机器学习/深度学习 运维 算法
|
16天前
|
存储 关系型数据库 分布式数据库
PolarDB,阿里云的云原生分布式数据库,以其存储计算分离架构为核心,解决传统数据库的扩展性问题
【7月更文挑战第3天】PolarDB,阿里云的云原生分布式数据库,以其存储计算分离架构为核心,解决传统数据库的扩展性问题。此架构让存储层专注数据可靠性,计算层专注处理SQL,提升性能并降低运维复杂度。通过RDMA加速通信,多副本确保高可用性。资源可独立扩展,便于成本控制。动态添加计算节点以应对流量高峰,展示了其灵活性。PolarDB的开源促进了数据库技术的持续创新和发展。
232 2
|
16天前
|
关系型数据库 分布式数据库 数据库
PolarDB,阿里云的开源分布式数据库,与微服务相结合,提供灵活扩展和高效管理解决方案。
【7月更文挑战第3天】PolarDB,阿里云的开源分布式数据库,与微服务相结合,提供灵活扩展和高效管理解决方案。通过数据分片和水平扩展支持微服务弹性,保证高可用性,且兼容MySQL协议,简化集成。示例展示了如何使用Spring Boot配置PolarDB,实现服务动态扩展。PolarDB缓解了微服务数据库挑战,加速了开发部署,为云原生应用奠定基础。
161 3
|
19天前
|
运维 Cloud Native 测试技术
《阿里云产品四月刊》—提升团队工程交付能力,从“看见”工程活动和研发模式开始(1)
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代
《阿里云产品四月刊》—提升团队工程交付能力,从“看见”工程活动和研发模式开始(1)
|
19天前
|
Cloud Native 数据库 持续交付
《阿里云产品四月刊》—提升团队工程交付能力,从“看见”工程活动和研发模式开始(2)
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代
《阿里云产品四月刊》—提升团队工程交付能力,从“看见”工程活动和研发模式开始(2)
|
19天前
|
Cloud Native 数据库 数据采集
《阿里云产品四月刊》—提升团队工程交付能力,从“看见”工程活动和研发模式开始(3)
阿里云瑶池数据库云原生化和一体化产品能力升级,多款产品更新迭代
《阿里云产品四月刊》—提升团队工程交付能力,从“看见”工程活动和研发模式开始(3)