作者:张凯,车漾
首日印象
2018年圣诞节临近,西雅图已经开始有了节日的气氛。而与此同时,在西雅图华盛顿州会议中心,CNCF的年终大戏---西雅图Kubecon和CloudNativeCon闪亮登场。经过近两年的传播和教育,云原生的概念深入人心,从people mount people sea的会场就可见一斑。这次会议共有八千名参会者,创造CNCF会史的记录。
首日Keynote内容中Kubernetes本身的更新并不多,倒是CNCF的其他成员Helm,prometheus,envy,linked,rook,vitess,grpc,NATS,HARBOR轮番上场,分别简略的介绍了一下自身的进展和计划。
首先登台亮相的是Helm,微软工程师主要谈到的是明年v3上的发布及变化,完全client端的架构,开发SDK支持,lua Hook。另外就是Helm Hub的介绍,以及其对应的开源版本:https://github.com/helm/monocular 。
今天最大的新闻就是明星项目etcd被RedHat捐献给了CNCF社区,而阿里巴巴的资深专家李响作为核心开发人员回顾了etcd的5年心路历程,以及与CNCF的不解之缘,比如etcd开始就使用了prometheus,并且从Rest切换成了GRPC。而etcd也因为它的稳定,简单,高性能的特性得到了社区认可和大量实际场景的锤炼。比如阿里集团的sigma和阿里云容器服务都深度使用了etcd,应该说etcd加入CNCF应该是实至名归。
在Kubernetes上跑深度学习
上午我们代表阿里云容器服务团队分享了《Using Kubernetes to Offer scalable deep learning on Alibaba Cloud》。通过大会日程注册感兴趣的有555人,目测现场听众有200多人。Nvidia,Mellanox,Huawei,Google, AWS都有开发人员和我们讨论,一些创业公司也希望尝试我们的Arena 开源项目。北美的kubernetes用户对AI on K8S很感兴趣,大会一共接收了12个与机器学习以及数据分析相关的演讲。
下午场主要参与了和AI相关的分享。KubeFlow作为在Kubernetes上运行机器学习作业的首选开源项目,依然是最热门的话题之一。不过相比于上海的CNCF并没有显著的更新,这也是两次会议时间过于接近造成的。主要介绍了KubeFlow 0.4的内容,其中最重要的是Pipeline,他们也进行了demo。不过现在的问题是gcr.io镜像已经硬编码到了bootstrapper了,这样造成在国内完全无法运行。我们会和google一起修复这个问题。另外一个就是KubeFlow路线图:
- 企业级可用 (IAM/RBAC, 升级)
- 更好的Jupyter Notebook集成支持
- 新项目pipeline中对实验结果比较和模型管理的支持
有趣和有情怀
其中另一个比较有趣的是,IBM利用KNative和OpenWhisk组件创建事件驱动的AI Pipeline,并且通过Istio用于流量管理和可观察性,以构建一个完整的pipeline。而他们实际的demo是通过argo实现的,这是由于argo能够通过web ui观测整个workflow的流程,而KNative目前还做不到。有趣的是,IBM的整体方案依然“很IBM”风格,用了很多独立的系统和组件串联成复杂的解决方案。
印象比较深刻的是对于Google云对于安全的分享,近日频繁爆出的Kubernetes安全漏洞引发了整个生态的忧虑,究竟下一个黑天鹅在哪里成了悬在Kubernetes头上的一达摩克利斯之剑。他们的第一个建议是Stay up to date,一定要保持Kubernetes最新版本。
下午的KeyNote更多的是情怀篇,来自Google的Principle Engineer :Tim Hockin 回顾了4年来Kubernetes的风风雨雨,如何从一叶小舟演进成了容器调度界的航空母舰。他着重感谢了社区的贡献,其实也从另一侧面反映Google在开源生态领域的能力和号召力。
还有哪些可以期待?
KubeCon+CloudNativeCon在北美的号召力确实不同凡响,从参会者和赞助商的数量增长可见一斑,但是频繁举办的Kubecon会导致没有足够多的时间创新和沉淀,内容显得有点中规中矩。而今天有幸遇到一同参会的卷爷,领略了大神针对微服务和服务网格方面的很多创新思想。比起被istio占据几乎所有相关话题的现状,确实令人眼前一亮。
另外缺乏大规模生产客户也是Kubernetes需要努力的地方,Mesos有Twitter,uber等一干用户,但是时至今日,原生Kubernetes大规模使用在企业生产系统的案例还鲜有见到。这也是社区需要共同努力的地方。
云原生的征程是星辰大海。安全、有状态应用、数据管理、多集群管理、更多类型作业的支持都需要不断强化...Kubernetes为代表的云原生领域,未来的方向和问题其实已比较明确,阿里云会继续深耕,携手广大用户共同拥抱云原生。