开发者社区> 问答> 正文

弹性高性能计算E-HPC节点管理API有哪些?

弹性高性能计算E-HPC节点管理API有哪些?

展开
收起
小天使爱美 2020-03-23 18:15:05 844 0
1 条回答
写回答
取消 提交回答
  • 批量增加计算节点。

    描述 可以批量增加 1-99 个计算节点,在增加计算节点前,您可以:

    调用 ListRegions 查询可用地域列表 调用 DescribeCluster 查询集群信息 请求参数 名称 类型 是否必需 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:AddNodes。 RegionId String 是 - 地域 ID。 ClusterId String 是 - 集群 ID。 Count Integer 是 - 添加的计算节点数量,取值范围:1-99。 ComputeSpotStrategy String 否 - 计算节点竞价策略,取值NoSpot、SpotWithPriceLimit 或 SpotAsPriceGo。 ComputeSpotPriceLimit String 否 - 设置实例的每小时最高价格,取值是浮点数,取值范围是当前的价格区间。 ImageOwnerAlias String 否 system 镜像类型,system、self、others 或 marketplace ImageId String 否 - 镜像 Id, 如果 ImageType 是system, 就只根据 OsTag 来决定基础镜像 ID; 如果是self、others 或 marketplace, ImageId 就是必填的。 InstanceType String 否 - 扩容的实例规格,如果没有配置,就使用上次扩容或者创建集群时的计算节点实例规格。 EcsChargeType String 否 PostPaid 集群使用ECS实例的付费类型,PostPaid:按量付费,PrePaid:包年包月。若选择包年包月类型,默认开启自动续费,节点释放后将关闭自动续费。 Period Integer 否 - 购买资源的时长,单位为:月。当参数 EcsChargeType 取值为 PrePaid 时才生效且为必选值。 PeriodUnit String 否 - 购买资源的时长。可选值 Week/Month。 AutoRenew Boolean 否 false true:自动续费;false:不自动续费。 AutoRenewPeriod Integer 否 1 每次自动续费的时长,当参数 AutoRenew 取值 True 时生效。 CreateMode String 否 manual 节点是如何创建的,manual 手动扩容, autoscale 自动扩容 返回参数 公共返回参数

    注: 由于AddNodes是异步操作,请求成功就会立即返回,不会等待实例创建,所以没有返回InstanceId,可以通过ListNodes查询节点列表来获取InstanceId

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=AddNodes&RegionId=cn-hangzhou&ClusterId=<集群ID>&Count=1&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368", "InstanceIds": { "InstanceId": [] } } 错误码 查询 E-HPC 接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    批量删除计算节点。

    描述 批量删除集群中的计算节点,请您确认已经导出节点上所有作业数据后再进行操作。在删除计算节点前,您可以:

    调用 ListRegions 查询可用地域列表 调用 DescribeCluster 查询指定集群信息 请求参数 名称 类型 是否必需 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:DeleteNodes。 RegionId String 是 - 地域 ID。 ClusterId String 是 - 集群 ID。 Instance.n.Id String 是 - 第 n 个(n 从 1 开始编号,可以有多条)要移除的节点实例 ID。 ReleaseInstance Boolean 否 true 是否释放由 E-HPC 创建的实例 返回参数 公共参数,了解更多请参阅 公共参数。

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=DeleteNodes&RegionId=cn-hangzhou&ClusterId=<集群ID>&Instance.1.Id=<实例ID>&Instance.2.Id=<实例ID>&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368" } 错误码 查询 E-HPC 接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    查询集群中节点列表。

    描述 查询用户集群中的节点列表,接口会返回所有节点信息。

    请求参数 名称 类型 是否必需 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:ListNodes。 RegionId String 是 - 地域 ID。 ClusterId String 是 - 集群 ID。 Role String 否 - 节点角色,可选项包括 Manager:管控节点,Login:跳板机,Compute:计算节点。 HostName String 否 - 节点名称,支持模糊查询, 支持 MySQL 的正则表达式。 OnlyDetached Boolean 否 false 是否仅查询不由 E-HPC 管理的节点信息。如果为true, 则仅返回不由 E-HPC 释放的节点(比如包月节点或者非 E-HPC 创建的节点)。 PageNumber Integer 否 1 显示的页码,起始值为 1。 PageSize Integer 否 10 每页显示的条数,1-50。 返回参数 除公共返回参数外返回如下结果:

    名称 类型 描述 Nodes Array 节点信息数组。 TotalCount Integer 列表条目总数。 PageNumber Integer 当前页码。 PageSize Integer 本页条数。 其中,NodeInfo 结构包含以下字段:

    名称 类型 描述 Id String 节点实例 ID。 RegionId String 地域 ID。 Status String 节点状态。 CreateByEhpc Boolean 是否由 E-HPC 创建,目前都是。 Role String 节点类别,Scheduler:主调度器,SchedulerBackup:备用调度器,Account:主域服务器,AccountBackup:备用域服务器,Login:跳板机,Compute:计算节点。调度器和域服务器都属于管控节点(Manager)。 Roles Array 否 TotalResources Struct 资源总量。 UsedResources Struct 计算节点资源使用量,其他类型节点返回值为空。 AddTime Date 加入集群时间。 SpotStrategy String 后付费实例的竞价策略。 LockReason String 节点被锁定类型,默认返回为空字符串。 ExpiredTime Date 包月节点到期时间。如果节点是按量节点,则此项为空。 Expired Boolean 包月节点是否到期。如果节点是按量节点,则为false。 ImageOwnerAlias String 镜像类型,system、self、others 或 marketplace。 ImageId String 镜像 ID。 Location String 节点所在位置,是本地节点 OnPremise 还是公共云上节点 PublicCloud 。 CreateMode String 节点是如何创建的,manual 手动扩容, autoscale 自动扩容 其中,计算节点资源 ResourceType 结构包含以下字段:

    名称 类型 描述 Cpu Integer CPU资源总量,单位:核。 Memory Integer 内存资源总量,单位:GB。 Gpu Integer GPU资源总量,单位:卡。 节点状态 Status 的可能取值:

    取值 描述 uninit 未初始化 init 初始化中 ready 空闲 running 运行中 exception 异常 示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=ListNodes&RegionId=cn-shanghai&ClusterId=<集群ID>&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 1 1 1 i-uf68t1zu3jkhs8wyxhil cn-shanghai running 2018-05-28T02:59:44.000Z false NoSpot system centos_7_02_64_20G_alibase_20170818.vhd public_cloud Compute 2 4096 0 0 0 0 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368" "TotalCount": 1, "PageNumber": 1, "PageSize": 1, "Nodes": { "NodeInfo" : [ { "Id": "i-uf68t1zu3jkhs8wyxhil", "RegionId": "cn-shanghai", "Status": "running", "AddTime": "2018-05-28T02:59:44.000Z", "Expired": false, "SpotStrategy": "NoSpot", "LockReason": "", "ImageOwnerAlias": "system", "ImageId": "centos_7_02_64_20G_alibase_20170818.vhd", "Location": "public_cloud", "TotalResources": { "Cpu": 2, "Memory": 4096, "Gpu": 0 }, "UsedResources": { "Cpu": 0, "Memory": 0, "Gpu": 0 } } ] } } 错误码 查询 E-HPC 接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    描述 不分页查询用户指定集群中的节点列表,接口会返回查询到的所有节点信息。

    请求参数 名称 类型 是否必需 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:ListNodesNoPaging。 RegionId String 是 - 地域 ID。 ClusterId String 是 - 集群 ID。 Role String 否 - 节点角色,可选项包括 Manager:管控节点,Login:跳板机,Compute:计算节点。 HostName String 否 - 节点名称,支持模糊查询, 支持MySQL的正则表达式。 OnlyDetached Boolean 否 false 是否仅查询不由 E-HPC 管理的节点信息。如果为true, 则仅返回不由 E-HPC 释放的节点(比如包月节点或者非 E-HPC 创建的节点)。 返回参数 除公共返回参数外返回如下结果:

    名称 类型 描述 Nodes Array 节点信息数组。 其中,NodeInfo 结构包含以下字段:

    名称 类型 描述 Id String 节点实例 ID。 RegionId String 地域 ID。 Status String 节点状态。 CreateByEhpc Boolean 是否由 E-HPC 创建,目前都是。 Role String 节点类别,Scheduler:主调度器,SchedulerBackup:备用调度器,Account:主域服务器,AccountBackup:备用域服务器,Login:跳板机,Compute:计算节点。调度器和域服务器都属于管控节点(Manager)。 Roles Array 节点角色类型数组 TotalResources Struct 资源总量。 UsedResources Struct 计算节点资源使用量,其他类型节点返回值为空。 AddTime Date 加入集群时间。 SpotStrategy String 后付费实例的竞价策略。 LockReason String 节点被锁定类型,默认返回为空字符串。 ExpiredTime Date 包月节点到期时间。如果节点是按量节点,则此项为空。 Expired Boolean 包月节点是否到期。如果节点是按量节点,则为false。 ImageOwnerAlias String 镜像类型,system、self、others 或 marketplace。 ImageId String 镜像 ID。 Location String 节点所在位置,是本地节点 OnPremise 还是公共云上节点 PublicCloud。 其中,计算节点资源 ResourceType 结构包含以下字段:

    名称 类型 描述 Cpu Integer CPU资源总量,单位:核。 Memory Integer 内存资源总量,单位:GB。 Gpu Integer GPU资源总量,单位:卡。 节点状态 Status 的可能取值:

    取值 描述 uninit 未初始化 init 初始化中 ready 空闲 running 运行中 exception 异常 示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=ListNodesNoPaging&RegionId=cn-shanghai&ClusterId=<集群ID>&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 i-uf68t1zu3jkhs8wyxhil cn-shanghai running 2018-05-28T02:59:44.000Z false NoSpot system centos_7_02_64_20G_alibase_20170818.vhd public_cloud Compute 2 4096 0 0 0 0 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368", "Nodes": { "NodeInfo" : [ { "Id": "i-uf68t1zu3jkhs8wyxhil", "RegionId": "cn-shanghai", "Status": "running", "AddTime": "2018-05-28T02:59:44.000Z", "Expired": false, "SpotStrategy": "NoSpot", "LockReason": "", "ImageOwnerAlias": "system", "ImageId": "centos_7_02_64_20G_alibase_20170818.vhd", "Location": "public_cloud", "TotalResources": { "Cpu": 2, "Memory": 4096, "Gpu": 0 }, "UsedResources": { "Cpu": 0, "Memory": 0, "Gpu": 0 } } ] } } 错误码 查询 E-HPC 接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    批量重置计算节点。

    描述 批量重置集群中的计算节点,在重置计算节点前,您可以:

    调用 ListRegions 查询可用地域列表 调用 DescribeCluster 查询指定集群信息 请求参数 名称 类型 是否必需 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:ResetNodes。 RegionId String 是 - 地域 ID。 ClusterId String 是 - 集群 ID。 Instance.n.Id String 是 - 第 n 个(n 从 1 开始编号,可以有多条)要重置的节点实例 ID。 返回参数 公共参数,了解更多请参阅 公共参数。

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=ResetNodes&RegionId=cn-hangzhou&ClusterId=<集群ID>&Instance.1.Id=<实例ID>&Instance.2.Id=<实例ID>&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368" } 错误码 查询 E-HPC 接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    启动集群中节点列表。

    描述 在停止集群中节点实例(StopNodes)后,可以批量启动集群中节点实例。

    请求参数 名称 类型 是否必需 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:StartNodes。 RegionId String 是 - 地域 ID。 ClusterId String 是 - 集群 ID。 Instance.n.Id String 是 - 第 n 个(n 从 1 开始编号,可以有多条)要移除的节点实例 ID。 Role String 否 Compute 节点角色,可选项包括 Manager:管控节点,Login:跳板机,Compute:计算节点。 返回参数 公共参数,了解更多请参阅 公共参数。

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=StartNodes&RegionId=cn-hangzhou&ClusterId=<集群ID>&Instance.1.Id=<实例ID>&Instance.2.Id=<实例ID>&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368" } 错误码 查询 E-HPC 接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    停止集群中节点列表。

    描述 批量停止集群中节点实例,在停止节点实例后,可以使用 StartNodes 接口来重新启动节点实例。

    请求参数 名称 类型 是否必需 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:StopNodes。 RegionId String 是 - 地域 ID。 ClusterId String 是 - 集群 ID。 Instance.n.Id String 是 - 第 n 个(n 从 1 开始编号,可以有多条)要移除的节点实例 ID。 Role String 否 Compute 节点角色,可选项包括 Manager:管控节点,Login:跳板机,Compute:计算节点。 返回参数 公共参数,了解更多请参阅 公共参数。

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=StopNodes&RegionId=cn-hangzhou&ClusterId=<集群ID>&Instance.1.Id=<实例ID>&Instance.2.Id=<实例ID>&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368" } 错误码 查询 E-HPC 接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    按队列查询节点信息。

    描述 按队列分组查询用户账户下单个集群的节点信息。

    请求参数 名称 类型 是否必需 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:ListNodesByQueue。 ClusterId String 是 - 集群ID。 RegionId String 是 - 地域 ID。 QueueName String 是 - 队列名。 PageNumber int 否 1 显示的页码,起始值为 1。 PageSize int 否 10 每页显示的条数,1-50。 返回参数 除公共返回参数外返回如下结果:

    名称 类型 描述 Nodes Array 节点信息数组。 TotalCount Integer 列表条目总数。 PageNumber Integer 当前页码。 PageSize Integer 本页条数。 其中,NodeInfo 结构包含以下字段:

    名称 类型 描述 AddTime Date 加入集群时间。 CreateMode String 节点是如何创建的,manual 手动扩容, autoscale 自动扩容 HostName String 主机名称。 Id String 节点实例 ID。 ImageId String 镜像 ID。 ImageOwnerAlias String 镜像类型,system、self、others 或 marketplace。 InstanceInfo String 实例详细信息。 IpInfo String IP详细信息。其中包含:PrivateIpAddress和PublicIpAddress两种。 Location String 节点所在位置,是本地节点 OnPremise 还是公共云上节点 PublicCloud 。 LockReason String 节点被锁定类型,默认返回为空字符串。 SpotStrategy String 后付费实例的竞价策略。 Status String 节点状态。 TotalResources Struct 资源总量。 UsedResources Struct 计算节点资源使用量,其他类型节点返回值为空。 VSwitchId String 虚拟交换机ID。 VpcId String 专有网络ID。 ZoneId String 实例可用区ID。 其中,计算节点资源 ResourceType 结构包含以下字段:

    名称 类型 描述 Cpu Integer CPU资源总量,单位:核。 Memory Integer 内存资源总量,单位:GB。 Gpu Integer GPU资源总量,单位:卡。 节点状态 Status 的可能取值:

    取值 描述 Uninit 未初始化 Init 初始化中 Ready 空闲 Running 运行中 Exception 异常 示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=ListNodesByQueue&RegionId=cn-hangzhou&ClusterId=<集群ID>&QueueName=workq&<公共请求参数> 返回示例 XML格式 1 3 50 5457B047-AC0A-4C75-B212-59759E38810F m-bpcccccccccccccccekw4cd 170.6.1.208 2 16384 m-bpcccccccccccccccccccc2ekw4cd cn-hangzhou-g true adb22432-ccccccccccccccccccccc219f784bfc7 2 16384 true sg-bp1ecccccccccoi6dtz linux CentOS 7.2 64位 vpc compute0 2019-04-22T11:53Z none cn-hangzhou false 2099-12-31T15:59Z ecs.r5 i-bpccccccccc9v788g 00:16:3e:11:8e:dd 172.16.1.208 eni-bp1ccccccccccccccueuoggzn5 0 PayByTraffic NoSpot Not-applicable 0 172.16.1.208 vsw-bp16ccccccccced144r vpc-bp1ccccccccq4txlicvt 0 2019-04-22T14:29Z ehpc-hz-5ccccc28c_compute0 CentOS 7.2 64 bit ecs.r5.large Running false PostPaid 0 public_cloud cn-hangzhou-g self vsw-bpccccccz6ted144r compute0 NoSpot manual vpc-bcccccccccubaq4txlicvt 0 0 running i-bp1ccccccv6e9v788g 2019-04-22T11:53:01.000Z JSON格式 { "PageNumber": 1, "TotalCount": 3, "PageSize": 50, "RequestId": "5457B047-AC0A-4C75-B212-59759E38810F", "Nodes": { "NodeInfo": [ { "ImageId": "m-bpcccccccccccccccekw4cd", "IpInfo": { "PrivateIpAddress": { "IpAddress": [ "100.16.1.208" ] }, "PublicIpAddress": { "IpAddress": [ "" ] } }, "TotalResources": { "Cpu": 2, "Memory": 16384 }, "InstanceInfo": { "ImageId": "m-bpcccccccccccccccccccc2ekw4cd", "VlanId": "", "EipAddress": { "IpAddress": "", "AllocationId": "", "InternetChargeType": "" }, "ZoneId": "cn-hangzhou-g", "IoOptimized": true, "SerialNumber": "adb22432-ccccccccccccccccccccc219f784bfc7", "Cpu": 2, "Memory": 16384, "DeviceAvailable": true, "SecurityGroupIds": { "SecurityGroupId": [ "sg-bp1ecccccccccoi6dtz" ] }, "SaleCycle": "", "AutoReleaseTime": "", "ResourceGroupId": "", "OSType": "linux", "OSName": "CentOS 7.2 64位", "InstanceNetworkType": "vpc", "HostName": "compute0", "CreationTime": "2019-04-22T11:53Z", "EcsCapacityReservationAttr": { "CapacityReservationPreference": "none", "CapacityReservationId": "" }, "RegionId": "cn-hangzhou", "DeletionProtection": false, "OperationLocks": { "LockReason": [] }, "ExpiredTime": "2099-12-31T15:59Z", "InnerIpAddress": { "IpAddress": [] }, "InstanceTypeFamily": "ecs.r5", "InstanceId": "i-bpccccccccc9v788g", "NetworkInterfaces": { "NetworkInterface": [ { "MacAddress": "00:16:3e:11:8e:dd", "PrimaryIpAddress": "172.16.1.208", "NetworkInterfaceId": "eni-bp1ccccccccccccccueuoggzn5" } ] }, "InternetMaxBandwidthIn": 0, "CreditSpecification": "", "InternetChargeType": "PayByTraffic", "SpotStrategy": "NoSpot", "StoppedMode": "Not-applicable", "InternetMaxBandwidthOut": 0, "VpcAttributes": { "NatIpAddress": "", "PrivateIpAddress": { "IpAddress": [ "172.16.1.208" ] }, "VSwitchId": "vsw-bp16ccccccccced144r", "VpcId": "vpc-bp1ccccccccq4txlicvt" }, "SpotPriceLimit": 0, "StartTime": "2019-04-22T14:29Z", "InstanceName": "ehpc-hz-5ccccc28c_compute0", "Description": "", "OSNameEn": "CentOS 7.2 64 bit", "PublicIpAddress": { "IpAddress": [] }, "InstanceType": "ecs.r5.large", "Status": "Running", "Recyclable": false, "ClusterId": "", "GPUSpec": "", "InstanceChargeType": "PostPaid", "GPUAmount": 0, "DedicatedHostAttribute": { "DedicatedHostId": "", "DedicatedHostName": "" }, "DeploymentSetId": "" }, "Location": "public_cloud", "ZoneId": "cn-hangzhou-g", "ImageOwnerAlias": "self", "VSwitchId": "vsw-bpccccccz6ted144r", "HostName": "compute0", "SpotStrategy": "NoSpot", "CreateMode": "manual", "VpcId": "vpc-bcccccccccubaq4txlicvt", "UsedResources": { "Cpu": 0, "Memory": 0 }, "Status": "running", "Id": "i-bp1ccccccv6e9v788g", "LockReason": "", "AddTime": "2019-04-22T11:53:01.000Z" }, ] } } 错误码 查询 E-HPC 接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    更新队列配置信息。

    描述 为集群中的队列更新资源组和计算节点实例的信息。

    请求参数 字段 类型 是否必须 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:UpdateQueueConfig ClusterId String 是 - 集群ID RegionId String 是 - 地域ID QueueName String 是 - 任务队列名 ResourceGroupId String 是 - 资源组ID ComputeInstanceType String 否 - 计算节点实例类型 返回参数 返回公共返回参数。

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=UpdateQueueConfig&RegionId=cn-hangzhou&ClusterId=<集群ID>&QueueName=workq&ResourceGroupId=<资源组ID>&<公共请求参数> 返回示例 XML格式 5198C3E8-85F5-4280-8547-687C1710FE08 JSON格式 { "requestId": "5198C3E8-85F5-4280-8547-687C1710FE08", } 错误码 查询E-HPC接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    2020-03-23 18:25:00
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Spring Boot2.0实战Redis分布式缓存 立即下载
CUDA MATH API 立即下载
API PLAYBOOK 立即下载