开发者社区> 问答> 正文

如何开始GPU 使用?

如何开始GPU 使用?

展开
收起
小天使爱美 2020-03-20 16:45:00 972 0
1 条回答
写回答
取消 提交回答
  • 首先说明下ECI GPU实例的设计初衷:无需要安装GPU驱动,ECI会预装GPU驱动;目前ECI GPU支持的驱动版本NVIDIA 410.79,按照NVIDIA官方给可支持到CUDA Toolkit版本是10.0。

    使用时可以通过GPU对应的docker镜像直接跑在ECI上,也不需要安装tensorflow,cuda toolkit等软件,比如tensorflow/tensorflow:1.13.1-gpu, nvidia/cuda

    使用方式 API CreateContainerGroup ECI API已经有介绍, 对于GPU的支持,需要在请求参数中增加一项

    请求参数中增加:

    名称 类型 是否必须 描述 InstanceType String 是 实例规格 Container中增加

    名称 类型 是否必须 描述 Gpu Integer 是 容器级别gpu个数 其中InstanceType使用ECS 实例规格标识。在CreateContainerGroup创建ECI GPU实例的时候,InstanceType 是需要给定,如果这个参数未给定,但是指定了Container中的Gpu,则请求会返回错误;

    ECI GPU实例是container级别的使用,所有container使用的Gpu个数加起来不能大于InstanceType中规定的个数,如果大于则CreateContainerGroup请求也会不成功

    UpdateContainerGroup 与CreateContainerGroup相似,如果要更新container中gpu的数量的话,UpdateContainerGroup的API接口也需要在container中加入Gpu参数:

    Container中增加

    名称 类型 是否必须 描述 Gpu Integer 是 容器级别gpu个数 其他接口比如RestartContainerGroup, DeleteContainerGroup等都保持原有参数不变; virtual kubelet使用说明 声明gpu-type pod 声明中增加 annotations:virtual-kubelet.io/gpu-type

    container 声明中增加 resources、limits、nvidia.com/gpu

    virtual-kubelet.io/gpu-type 可选值为P4, V100, T4,P100

    resources、limits、nvidia.com/gpu 的可选值为1、2、4、8

    apiVersion: v1 kind: Pod metadata: name: podname annotations: "virtual-kubelet.io/gpu-type" : "P4" spec: containers: resources: limits: "nvidia.com/gpu": "1" 声明ecs vm类型 这种方式为直接声明使用的ecs实例

    pod声明中增加annotations:k8s.aliyun.com/eci-instance-type

    这种声明的优先级会高于上一种方式

    apiVersion: v1 kind: Pod metadata: name: podname annotations: "k8s.aliyun.com/eci-instance-type" : "ecs.gn5i-c4g1.xlarge"

    2020-03-20 16:52:41
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载