阿里 Pouch 技术开源负责人孙宏亮:如何在复杂场景下实现容器技术的大规模运用-阿里云开发者社区

开发者社区> yq传送门> 正文

阿里 Pouch 技术开源负责人孙宏亮:如何在复杂场景下实现容器技术的大规模运用

简介: 在双十一买买买的狂潮之后,阿里选择第一时间将 Pouch 技术开源,无疑,这又一次吸引无数开发者的目光。 借助阿里将自研容器技术 Pouch 开源的契机,采访了阿里 Pouch 技术的开源负责人孙宏亮。
+关注继续查看

日前,在2017中国开源年会上,阿里巴巴自研容器技术 Pouch 宣布开源。在双十一买买买的狂潮之后,阿里选择第一时间将 Pouch 技术开源,无疑,这又一次吸引无数开发者的目光。

借助阿里将自研容器技术 Pouch 开源的契机,记者第一时间采访到阿里 Pouch 技术的开源负责人孙宏亮。他目前负责的内容包含制定 Pouch 技术发展方向,管理与维护 Pouch 开源社区。记者与他详细探讨了 Pouch 技术的一些关键细节,此次开源的缘由以及下一步的展望。

fd5ddb2bb2e70518fecc494a74149705943ea68a

图:阿里 Pouch 技术开源负责人孙宏亮

阿里“云化战略”与容器技术

谈及 Pouch 技术之前,先来说说阿里在今年双十一的“云化战略”。云化技术战略是阿里集团基础设施近年来一直在努力的方向,这其中包括混合云、资源 Pouch 容器化、统一调度、存储计算分离和混部等多项技术的不断突破和创新。这一战略是支撑今年庞大支付量(3 分钟 GMV 超百亿,一小时 GMV 近 600 亿,零点后交易峰值 32.5 万笔/秒,支付峰值 25.6 万笔/秒)的基础,而 Pouch 容器技术在这一战略中占据了尤为重要的地位,它对业务没有任何侵入性,是实现便捷调度,统一基础运维资源接口的基础。

据悉,截止到今年双 11,阿里已在集团范围内实现在线服务全部 Pouch 容器化,内部已达到百万级容器部署规模。

作为一种轻量级、可移植、自包含的软件打包技术,容器技术可以使应用程序在几乎任何地方以相同的方式运行。开发人员在自己笔记本上创建并测试好的容器,无需任何修改就能够在生产系统的虚拟机、物理服务器或公有云主机上运行。但目前来说,以 Docker 为主的容器技术占据了全球大部分市场,中国企业所占的市场份额少之又少。

自研 Pouch

配置快速简单、隔离性和安全性强等,这一系列技术特点让 Docker 成为容器界的网红。事实上,占据庞大市场份额的 Docker 不失为一个好选择,为何阿里会选择自研容器技术,AI科技评论向孙宏亮提出了这个疑问。

他表示,“阿里巴巴不能算是一家软件公司,而是一家技术驱动型公司。在业务的变化之下,需要技术能快速灵活的应对。社区版本的 Docker 的确是业界数一数二的软件,但是在面对一些场景时,难免存在开源软件的弊端。”

他也进一步说明——开源软件的发布周期是有计划的,很明确,但在面对快速变化的业务时,选择这类软件不是一个好方法。”技术在很多时候都是为了更好地支撑业务,本着业务第一的角度,始终要在‘follow开源软件’和‘自研软件自主可控’方面做出一个选择,阿里巴巴毫无意外选择了后者‘自研 Pouch 容器技术’。”

出于技术互补的考量,他们将 Docker 技术与阿里容器技术产品 T4 都做了一些修改整合后,将两者融合为了一个产品,这个产品在阿里内部被称为 AliDocker,也就是 Pouch 的前身。

97e3bd396bda9a471a948de589d24034c6bc7b00

图:Pouch演进之路

T4 是阿里在2011年的时候基于 Linux Container(LXC) 开发的容器技术基础设施。相比 Docker 的模式和理念,T4 其实更适合阿里内部的运维现状。T4 是从阿里内部的资源管理和日常运维中土生土长出来的产品,在诞生的第一天就针对内部基础设施、运维工具甚至是运维习惯做了很多特别的设计。因此,在阿里内部进行容器管理时,融合 T4 的 Pouch 技术比起 Docker 来说会稍胜一筹。

958b59d6d9fcbf30d0002e1f5bbbb154244f7e28

图:阿里 Pouch 技术历史

“Docker 诞生并走向流行的主要原因在于其提出的‘镜像技术’。Docker 对行业产生深远影响的是 Docker 镜像,这一点对于大型的互联网公司而言,相信肯定深有感触。因此,Docker 镜像流行开来之后,阿里巴巴没有理由不去接受这种给行业带来大价值的技术。”孙宏亮对AI科技评论说道,“这也就回到了‘阿里容器技术融合 Docker 镜像’的这一事实上。另外,一方面,Docker 社区中一些优秀的设计理念以及好的功能实现,我们也在 Pouch 版本中引入,保障 Pouch 和社区的同步。”

关键考虑

Pouch 容器技术的诞生过程中究竟有哪些棘手问题?孙宏亮对AI科技评论说道,“容器的运用不是一个难题,容器技术的大规模运用却是一个十分棘手的问题。要想实现大规模应用,容器技术必须要有能力覆盖足够多的场景。而场景复杂的环境中,安全、性能、稳定问题都会逐渐暴露出来。”

他具体解释了如下三个关键方面:安全、性能、稳定性。

  • 安全方面,主要在 Pouch 技术的隔离功能上线这一节点。在这个节点上,阿里内核也提供了相应的隔离特性,Pouch 也实现了磁盘隔离、网络隔离等功能,从而初步具备大规模应用的能力。
  • 性能方面,主要在 Pouch 支持P2P镜像分发这一节点。企业数据中心集群规模上升之后,容器镜像的传输效率、镜像仓库的网络能力很容易成为瓶颈,为此阿里巴巴研发了镜像分发工具“蜻蜓”,保障镜像分发效率,从而保障业务分发速度。
  • 当安全与性能达标之后,随着规模的继续增长,Pouch 的稳定性提升就成为新的发展拐点。Pouch 在2017年双11的接近一年时间内,投入了巨大精力提升 Pouch 的稳定性,同时对稳定性的指标要求也是不断在提高。直到今年双11,1682亿交易额背后拥有百万级容器规模的支撑集群,也极大的验证了稳定性的战役取得了不小的成绩。

“数年如一日,长时间的技术锤炼与经验积累,铸就了阿里容器今天的成绩。阿里巴巴长时间踩过的坑、走过的弯路,让 Pouch 以一个务实者的姿态出现在如今的容器生态圈,阿里认为‘只有 Pouch 更懂应用,更贴近场景’。”孙宏亮由衷感慨。

他表示,他们目前依然处于攻克一些容器技术难题的过程中,这些技术难题,主要围绕在容器的安全隔离性方面。传统容器主要完全依赖于 Linux 内核的特性提供隔离,而他们认为这样的隔离方式存在缺陷。他进一步陈述到,

  • 第一,我们 Pouch 团队积极与阿里内核团队展开研究合作,在内核架构层面提出创新,尝试让未来的内核技术解决容器技术的隔离性问题。
  • 与此同时,容器技术在软硬件结合层面,依然有很多技术创新的可能性,在基于轻量级虚拟化技术的容器实现中,我们也在于虚拟化团队尝试为 Pouch 做硬件适配,保障提供基于 hypervisor 的隔离性,同时提供硬件加速提高效率。

拥抱开源生态

此次开源对阿里的战略意义何在?

孙宏亮对AI科技评论如此说道,“虽然目前容器生态中关于容器引擎方面,已经有了比较成熟的产品,但是阿里巴巴认为,现有的容器技术在技术落地方面仍然存在一些不足之处。比如,现有的容器技术,对企业的传统应用侵入性依然很高,这也就导致了企业在走向云化,拥抱 Cloud Native 方面存在现实阻力。而阿里内部之所以可以做到业务100%容器化,主要是借助阿里巴巴集团系统软件部对业务系统的了解,与容器技术 Pouch 的不断优化。而 Pouch 这方面的技术优势,对行业无疑是拥有难以估量的价值的,阿里巴巴希望通过开源的方式,把经验和心得与行业共享,真正让行业在云化道路上加快进程,早日拥抱 Cloud Native。”

166be69c85a788d00c60733143db00531dd0c2b0

图:阿里 Pouch 开源计划

阿里巴巴对于 Pouch 的开源计划则主要围绕3点:拥抱生态,解耦依赖与合作共建。

  • 拥抱生态是什么意思呢? 他们希望以标准化的方式去做一些事情,比如,会去兼容 CNCF 基金会中的 kubernetes 生态,会在网络、存储等标准化作出贡献。
  • 解耦依赖,主要是指的阿里容器技术目前和内部系统仍有部分耦合,他们会解耦依赖,抽离通用部分,贡献给社区。
  • 合作共建指的是他们会和合作伙伴一起共建生态,目前他们已经和浙江大学SEL实验室等合作伙伴达成协议,共同参与开源生态,打造国际知名容器品牌。

目前,阿里巴巴容器技术 Pouch 团队有十余位工程师在做开源建设。在采访中,孙宏亮也提到,他们在持续招聘容器领域的专家,预计到18年上半年,这个团队会扩大至20人以上。

Pouch 的代码也已经在 GitHub 公开,大家可以到这个地址查看详情:

https://github.com/alibaba/pouch

原文发布时间为:2017-11-25

本文作者:Non

本文来自云栖社区合作伙伴“AI科技评论”,了解相关信息可以关注“AI科技评论”。



版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
双11阿里云技术负责人杨旭:大考亦从容
杨旭,花名杨曦,这是他的第六个双11。 从2012年开始,阿里云通过云计算技术为天猫双11提供计算服务。 3年前,杨旭开始作为双11阿里云技术负责人,负责搭建全球最大的混合云结构,把 “双11”的电商业务和技术场景在阿里云上实现,并保障这个混合云在双11当天能够满足全球客户的购物需求。
4668 0
阿里云新品发布会周刊第68期 丨 阿里云cGPU容器技术重磅发布!
阿里云开放平台全新推出的“阿里云配额中心”,并以GPU资源为例,演示如何通过配额中心在线查看配额,自助申请提升配额和跟踪申请状态。9月9日阿里云新品发布会与您不见不散!
478 0
阿里园区生态技术联盟启动大会
2017年11月28-29日,来自全国六大城市的九位生态技术联盟成员齐聚阿里巴巴杭州西溪园区,开展启动大会。首届生态技术联盟成员有上海驻云信息科技、杭州数梦工场科技有限公司、杭州玳数科技有限公司、广东创云科技有限公司、四川捷云信通信息技术有限公司、天津云顶云科技有限公司、浙江卓见云科技有限公司、北京青苔数据科技有限公司、广州青莲网络科技有限公司。
2757 0
阿里10年:一个普通技术人的成长之路
不管是什么角色,成长是我们每个人都必须经历的过程。作为一个技术人,成长不仅是技术上的不断精进,也包括日常工作中的方方面面。本文分享阿里巴巴高级技术专家在阿里10年的成长之路,分享他从一个普通技术人开始,在阿里的三个阶段,以及在晋升、转岗、带团队、做事等方面的心得感悟。
10173 0
VMware顺容器之势而为,发布开源项目Lightwave和Photon
本文讲的是VMware顺容器之势而为,发布开源项目Lightwave和Photon,【编者的话】VMware是老牌的虚拟化技术提供商,但Docker等容器技术对其核心业务造成了不小的冲击,为了应付这种冲击,并顺应潮流,VMware发布了两个新的开源项目,Project Lightwave和Project Photon,这两个项目都是致力于提高云应用以及企业架构的扩展性。
1143 0
阿里的开源思想:与世界讨论中国的互联网技术与场景
阿里的开源思想:与世界讨论中国的互联网技术与场景
1065 0
快的打车将迁入阿里云 打技术军备竞赛
本文讲的是快的打车将迁入阿里云 打技术军备竞赛记者27日从快的打车了解到,由于短期内订单量暴增十倍以上,之前储备的服务器资源很快要接近极限,快的将于近日迁移到阿里云的云计算服务平台。这也意味着在大打补贴战的同时,快的将依托阿里云开打"技术军备竞赛",进一步拉开与同行的差距,以期给用户提供更好的出行体验。
1515 0
SOCK: Serverless场景的runc容器启动优化方案
> [原文链接 SOCK: Rapid Task Provisioning with Serverless-Optimized Containers](https://www.usenix.org/system/files/conference/atc18/atc18-oakes.pdf) > 译者 据德 ### 一. 摘要 Serverless计算平台能够为用户降低生产成本以及
1525 0
活动总结:阿里专家技术问答第二期,HTML5,我有话说!
1月26日推出的是第二期专家问答“HTML5,我有话说",由前端专家胡才俊(昵称:前道)来为大家解答在HTML5开发工作和学习中遇到难题,各位前端攻城狮们,请叫我雷锋!
7597 0
+关注
797
文章
18
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载