容器服务深度学习怎么创建容器集群-问答-阿里云开发者社区-阿里云

开发者社区> 问答> 正文

容器服务深度学习怎么创建容器集群

反向一觉 2017-10-30 16:49:03 2964
深度学习解决方案支持使用云服务器 ECS 容器集群或者 GPU 服务器容器集群。本文档以 GPU 服务器容器集群为例进行说明。
[backcolor=transparent]注意:有关如何创建 ECS 容器集群,参见 创建集群

使用限制
  • 目前,容器服务仅支持在华南 1 、华东 2、华北 2 和美西地域创建 GN4 型 GPU 云服务器集群。
  • 目前,GN4 型 GPU 云服务器只支持专有网络(VPC)。
  • 用户账户需有 100 元的余额并通过实名认证,否则无法创建按量付费的 ECS 实例和负载均衡。

提前准备
目前,按量付费的 GPU 计算型 GN4 云服务器需要申请工单开通。如果您需要使用按量付费的 GPU 计算型 GN4 云服务器,请按照如下内容 提交 ECS 工单
我需要申请按量付费的GPU计算型gn4,请帮忙开通,谢谢。

操作流程
  1. 登录 容器服务管理控制台
  2. 单击左侧导航中的 [backcolor=transparent]集群,单击右上角的 [backcolor=transparent]创建集群。

  3. 设置集群的基本信息。本示例中创建一个位于华南 1 地域名为 [backcolor=transparent]EGS-cluster 的集群。
    • [backcolor=transparent]集群名称: 要创建的集群的名称。可以包含 1~64 个字符,包括数字、中文字符、英文字符和连字符 (-)。

      [backcolor=transparent]注意: 集群名称在同一个用户和同一个地域下必须唯一。
    • [backcolor=transparent]地域: 所创建集群将要部署到的地域。选择 [backcolor=transparent]华南 1、[backcolor=transparent]华东 2 或 [backcolor=transparent]华北 2。

      [backcolor=transparent]注意:目前,仅支持在华南 1、华东 2 和华北 2 地域创建 GN4 型 GPU 云服务器集群。
    • [backcolor=transparent]可用区:集群的可用区。

      [backcolor=transparent]注意:您可以根据您的服务器分布情况,选择不同的地域和可用区。

  4. 设置集群的网络类型为 [backcolor=transparent]专有网络 并配置相关信息。

    专有网络 VPC 支持您基于阿里云构建一个隔离的网络环境,您可以完全掌控自己的虚拟网络,包括自由 IP 地址范围、划分网段、配置路由表和网关等。
    专有网络需要您指定一个 VPC、一个 VSwitchId 和容器的起始网段(Docker 容器所属的子网网段,为了便于 IP 管理,每个虚拟机的容器属于不同网段,容器子网网段不能和虚拟机网段冲突)。
    为了防止网络冲突等问题,建议您为容器集群建立属于自己的 VPC/VSwitchId。

  5. 添加节点。

    您可以在创建集群的同时创建若干个节点,或者创建一个零节点集群并添加已有云服务器。有关如何添加已有云服务器的详细信息,参见 添加已有云服务器
    • [backcolor=transparent]创建节点
      设置节点的操作系统。

      目前支持的操作系统包括 Ubuntu 14.04/16.04 64 位和 CentOS 7.0 64 位。
    • 设置云服务器的实例规格。[backcolor=transparent]实例系列 选择 [backcolor=transparent]系列III。
    • [backcolor=transparent]实例规格 选择 [backcolor=transparent]32核 48GB(ecs.gn4.8xlarge) 或 [backcolor=transparent]56核 96GB(ecs.gn4.14xlarge)。

      [backcolor=transparent]注意:如果您已经通过了 GN4 型 GPU 云服务器的使用申请,但是未找到这两种实例规格,说明目前这两种规格的实例没有资源,建议晚些时候或者次日再尝试购买。

    您可选择实例的数量,并指定数据盘的容量(云服务器默认带有 20G 大小的系统盘)和登录密码。

    [backcolor=transparent]注意:
    • 如果您选择了数据盘,它会被挂载到 /var/lib/docker 目录,用于 Docker 镜像和容器的存储。
    • 从性能和管理考虑,建议您在宿主机挂载独立的数据盘,并利用 Docker 的 volume 对容器的持久化数据进行管理。

  6. [backcolor=transparent]添加已有节点
    您可以单击下边的 [backcolor=transparent]选择已有实例 将已有的云服务器添加到集群中,或者直接单击 [backcolor=transparent]创建集群 等集群创建完成后再通过集群列表页面添加已有云服务器。
    配置 EIP。
    当您将网络类型设置为 VPC 时,容器服务会默认给每一个专有网络下的云服务器配置一个 EIP。如果不需要,您可以勾选 [backcolor=transparent]不配置公网EIP 复选框,但是需要额外配置 SNAT 网关。

    创建一个负载均衡实例。

    目前创建集群会默认创建一个负载均衡实例。您可以通过这个负载均衡实例访问集群内的容器应用。所创建的负载均衡实例为按量付费实例。
    单击 [backcolor=transparent]创建集群。

    后续操作

    您可以查看集群创建日志。在 [backcolor=transparent]集群列表 页面,选择所创建的集群并单击 [backcolor=transparent]查看日志。

    机器学习/深度学习 存储 弹性计算 负载均衡 Ubuntu 网络安全 数据安全/隐私保护 异构计算 Docker 容器
    分享到
    取消 提交回答
    全部回答(0)
    云计算
    使用钉钉扫一扫加入圈子
    + 订阅

    时时分享云计算技术内容,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。

    推荐文章
    相似问题