使用阿里云容器服务Kubernetes实现蓝绿发布功能
背景
在发布应用时,经常需要先上线一个新版本,用较小的流量去测试一下该新版本的可用性。但是Kubernets的ingress resource 并没有实现流量控制与切分的功能,导致针对同一个域名下的路径,只能有一个service来进行服务。
kubernetes 运行AI任务实践 资料下载
分享嘉宾
徐晓舟 2015年加入阿里巴巴基础产品事业部-容器平台-容器服务高级开发工程师多年容器平台产品开发经验目前主要负责参与Kubernetes专有云与Kubernetes深度学习解决方案的研发工作
主题介绍
Kubernetes与深度学习介绍
阿里云的Kubernetes深度学习解决方.
阿里云容器服务简介
容器服务是一项高性能可扩展的容器管理服务,支持在一组阿里云云服务器上通过 Docker容器来部署或编排应用。用户不再需要安装、运维、扩展自己的集群管理基础设施,而是可以直接通过阿里云控制台图形化界面或API进行容器操作和生命周期管理。
开源工具GPU Sharing:支持Kubernetes集群细粒度
问题背景
全球主要的容器集群服务厂商的Kubernetes服务都提供了Nvidia GPU容器调度能力,但是通常都是将一个GPU卡分配给一个容器。这可以实现比较好的隔离性,确保使用GPU的应用不会被其他应用影响;对于深度学习模型训练的场景非常适合,但是如果对于模型开发和模型预测的场景就会比较浪费。
如何在Kubernetes集群动态使用 NAS 持久卷
介绍:
本文介绍的动态生成NAS存储卷的方案:在一个已有文件系统上,自动生成一个目录,这个目录定义为目标存储卷;
镜像地址:registry.cn-hangzhou.aliyuncs.com/acs/alicloud-nas-controller:v1.11.5.4-433631d-aliyun
默认生成资源:生成的PV名字为:pvc-${pvc-uid}生成目录的名字:namespace-pvcname-pvname
可以再pvc的annotations中如下声明,自定义名字:生成的pv、目录名字为下面定义的名字。