备案控制台

开发者社区问答正文

服务编排的gpu

申请 GPU 资源，将容器调度到满足可用 GPU 资源个数的机器上并将 GPU 资源分配给容器。
[backcolor=transparent]标签格式：
aliyun.gpu: "1"
aliyun.gpu 指定申请的 GPU 资源的个数。容器服务调度器会寻找满足可用 GPU 资源个数的机器，将容器部署到该机器上，将 GPU 资源分配给容器并将主机上的 GPU 卡映射到容器内。容器所分配到的 GPU 资源对于您是透明的。具体来说：
例如，如果您申请了一个 GPU 资源，主机上只有一个 /dev/nvidia1 可用，容器服务会将主机上的/dev/nvidia1 映射为容器里的 /dev/nvidia0。这样会让您的程序和具体的设备号解耦。
[backcolor=transparent]示例：

[backcolor=transparent]serving[backcolor=transparent]:
[backcolor=transparent] image[backcolor=transparent]:[backcolor=transparent] inception[backcolor=transparent]-[backcolor=transparent]serving[backcolor=transparent]:[backcolor=transparent]gpu
[backcolor=transparent] labels[backcolor=transparent]:
[backcolor=transparent] aliyun[backcolor=transparent].[backcolor=transparent]gpu[backcolor=transparent]:[backcolor=transparent] [backcolor=transparent]"1"

展开

收起

反向一觉 2017-10-27 16:40:18 1816 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

看起来您希望在阿里云的容器服务中申请并使用GPU资源。您的描述已经很接近正确的配置方式了，但似乎在示例中最后一个标签部分有格式上的小错误。让我帮您修正一下这个配置示例：

serving:
  image: inception-serving:gpu
  labels:
    aliyun.gpu: "1"

在这个修正后的示例中，serving 部分定义了一个服务，它使用的镜像是 inception-serving:gpu，这表明该镜像应该是为GPU优化过的。然后，在 labels 下，通过 aliyun.gpu: "1" 正确地指定了需要申请1个GPU资源。

当您在阿里云的Kubernetes集群（如ACK）中使用这样的配置部署服务时，容器服务的调度器会识别到您对GPU资源的需求，并尝试将这个容器调度到具有可用GPU资源的节点上。如果节点上有多个GPU，容器服务会负责映射合适的GPU设备到容器内部，确保容器内的程序可以无感知地使用到请求的GPU资源，正如您之前描述的那样，可能将主机上的 /dev/nvidia1 映射为容器里的 /dev/nvidia0。

记得在实际部署前，确保您的集群已经配置了支持GPU的节点，并且安装了必要的驱动和工具包，比如NVIDIA的设备插件，以保证GPU资源能够被Kubernetes正确识别和管理。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

调度异构计算容器容器计算服务 GPU云服务器

问答标签：

GPU云服务器服务

问答地址：

开发者社区 > 云计算 > 问答

相关问答

云原生 AI 套件中，阿里云的ack服务，部署的代码想要检测宿主机是否有GPU资源，这个有方案么？

175

2

0

神龙AI中请问我在购买了gpu云服务后能否在安装AIACC后直接达到加速效果？

97

1

0

我们机器学习PAI部署EAS服务都是正常的，突然就报错GPU资源不足了？

188

1

0

函数计算，FC能不能提供自带 cuda cudnn8 的基础镜像。我需要用FC的gpu服务。但是镜

133

1

0

modelscope-funasr的GPU离线转写服务的说话人识别模块要怎么配置啊？

243

0

0

modelscope-funasr的 docker gpu1.1 容器中启动服务时，报这个是啥问题？

190

1

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的参数量是一样的么？

182

0

0

modelscope-funasr最新的gpu高吞吐服务用的模型和原来cpu的是一样的么？

136

0

0

modelscope-funasr使用gpu转写服务部署指南，asr模型还是会需要导出为onnx吗？

149

0

0

FunASR离线文件转写服务GPU版本部署，这里的“每路分配1G显存”，在哪里设置呢？

198

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

钉钉:因安全管控限制,16位参与人无法直接添加到日程

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

阿里云2核2G3M适合搭建个人博客或小型项目吗？

4M带宽的阿里云服务器适合运行用户量较小的小程序吗？

运行一个基础的Spring Boot应用至少需要多少内存？

相关文章

容器可观测新视角： SysOM延时监控助力定位业务抖动原因

掌握Dify工作流：我跳槽时薪资提升40%的秘诀！

水利数字孪生技术深度分享

从工具逻辑到架构思维：企业级低代码的演进与重塑

为什么 OpenSearch 向量检索能提速 13 倍？

还有其他疑问?