开发者社区> 问答> 正文

弹性高性能计算E-HPC作业管理API有哪些?

弹性高性能计算E-HPC作业管理API有哪些?

展开
收起
小天使爱美 2020-03-23 22:43:16 915 0
1 条回答
写回答
取消 提交回答
  • 创建作业文件。

    描述 在提交作业接口调用之前,会先调用该接口创建一个作业的配置文件。

    请求参数 字段 类型 是否必须 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:CreateJobFile RegionId String 否 - 地域ID ClusterId String 是 - 集群ID TargetFile String 是 - 目标文件 Content String 是 - 作业文件内容 RunasUser String 是 - 作业所属用户 RunasUserPassword String 是 - 作业用户密码 返回参数 返回公共返回参数。

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=CreateJobFile&RegionId=cn-hangzhou&ClusterId=<集群ID>&TargetFile=/home/testuser1/lammps.pbs&Content=<作业内容>&RunasUser=testuser&RunasUserPassword=<用户密码>&<公共请求参数> 返回示例 XML格式 8C337EA7-B27E-46C5-A640-164CCA173F1F JSON格式 { "RequestId": "8C337EA7-B27E-46C5-A640-164CCA173F1F", } 错误码 查询E-HPC接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    批量删除作业。

    描述 批量删除作业,在删除作业前,您可以:

    调用ListJobs查询作业列表 请求参数 字段 类型 是否必须 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:DeleteJobs RegionId String 是 - 地域ID ClusterId String 是 - 集群ID Jobs String 是 - 作业Id列表 [{“Id”:”xx”}],如:[{“Id”:”2.scheduler”}] 返回参数 公共参数,了解更多请参阅 公共参数。

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=DeleteJobs&RegionId=cn-hangzhou&ClusterId=<集群ID>&Jobs=[{"Id":"1"}, {"Id":"2"}]&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368", } 错误码 查询E-HPC接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    查询作业列表。

    描述 查询单个集群中作业列表。

    请求参数 字段 类型 是否必须 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:ListJobs RegionId String 是 - 地域ID ClusterId String 是 - 集群ID Owner String 否 - 作业owner State String 否 - 作业状态, finished / notfinish PageNumber Integer 否 1 显示的页码,起始值为 1 PageSize Integer 否 10 每页显示的条数,1-50 返回参数 除公共返回参数外返回如下结果:

    字段 类型 描述 Jobs Array 作业信息数组,JobInfo结构见下面的对象描述 TotalCount Integer 列表条目总数 PageNumber Integer 当前页码 PageSize Integer 本页条数 其中,每个JobInfo结构包含以下字段:

    字段 类型 描述 Id String 作业ID Name String 作业名称 Owner String 作业owner Priority Integer 优先级 State String 作业状态 NodeList String 执行作业节点列表 SubmitTime String 作业提交时间 StartTime String 作业开始时间 LastModifyTime String 作业最后修改时间 Stdout String 标准输出位置 Stderr String 错误输出位置 Comment String 作业当前描述 ArrayRequest String 队列作业的队列输入,例如 1-10:2, 如果不是作队列,可以为空 Resources Struct 作业运行所需资源 ShellPath String 运行程序路径 Rerunable String 作业是否可重运行(只有pbs支持) 其中,Resources 结构包含以下字段:

    字段 类型 描述 Nodes String 作业运行的节点数量 Cores String 作业运行的cpu核数 示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=ListJobs&RegionId=cn-hangzhou&ClusterId=<集群ID>&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 1 1 1 root 2018-07-18T17:46:47 4294901759 sleepjob.sh COMPLETED 2018-07-18T17:46:58 2 2018-07-18T17:46:48 ['compute1', 'compute3'] 2 0 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368", "TotalCount": 1, "PageNumber": 1, "PageSize": 1, "Jobs": { "JobInfo": [ { "Owner": "root", "SubmitTime": "2018-07-18T17:46:47", "Stderr": "", "Comment": "", "ArrayRequest": "", "Priority": "4294901759", "Name": "sleepjob.sh", "State": "COMPLETED", "LastModifyTime": "2018-07-18T17:46:58", "Stdout":"", "Id": "2", "StartTime": "2018-07-18T17:46:48", "NodeList":"['compute1', 'compute3']", "Resources": { "Nodes": 2, "Cores": 0 } } ] } } 错误码 查询E-HPC接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    设置作业owner。

    描述 在单个集群中设置作业owner。

    请求参数 字段 类型 是否必须 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:SetJobUser RegionId String 是 - 地域ID ClusterId String 是 - 集群ID Runasuser String 是 - 作业owner RunasUserPassword String 是 - 作业owner密码 返回参数 公共参数,了解更多请参阅 公共参数。

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=SetJobUser&RegionId=cn-hangzhou&ClusterId=<集群ID>&Runasuser=<作业用户名>&RunasUserPassword=<作业用户密码>&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368", } 错误码 查询E-HPC接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    批量停止作业。

    描述 用户可以批量停止作业,在停止作业前,您可以:

    调用ListJobs查询作业列表 请求参数 字段 类型 是否必须 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:StopJobs RegionId String 是 - 地域ID ClusterId String 是 - 集群ID Jobs String 是 - 作业ID列表,格式为: [{“Id”:”xx”}],如:[{“Id”:”2.scheduler”}] 返回参数 公共参数,了解更多请参阅 公共参数。

    示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=StopJobs&RegionId=cn-hangzhou&ClusterId=<集群ID>&Jobs=[{"Id":"1"},{"Id":"2"}]&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368" } 错误码 查询E-HPC接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    提交作业。

    描述 在单个集群提交作业,在提交作业前,您可以:

    调用CreateJobTemplate创建作业模板 调用ListJobTemplates查看作业模板列表 注意:请先把作业文件(e.g. job.sh)放到集群节点上再进行作业的提交。

    请求参数 字段 类型 是否必须 默认值 描述 Action String 是 - 操作接口名,系统规定参数,取值:SubmitJob RegionId String 是 - 地域ID ClusterId String 是 - 集群ID CommandLine String 是 - 作业命令 Name String 否 - 作业名称 RunasUser String 是 - 作业owner RunasUserPassword String 是 - owner password Priority Integer 否 - 作业优先级 PackagePath String 否 - 作业命令所在目录 StdoutRedirectPath String 否 - stdout输出目录 StderrRedirectPath String 否 - stderr输出目录 ReRunable Boolean 否 - 作业是否支持rerun ArrayRequest String 否 - 队列作业, 格式是1-10:2 Variables String 否 - 作业的环境变量,格式是:[{Name:,Value:},{Name:,Value:}] ContainerId String 否 - 容器应用Id。如果选择使用容器则需提供容器应用Id。 InputFileUrl String 否 - 引入作业文件的URL地址。 PostCmdLine String 否 - 作业后处理命令。 UnzipCmd String 否 - 解压命令。接下使用oss下载的文件。 返回参数 除公共返回参数外返回如下结果:

    字段 类型 描述 JobId String 作业ID 示例 请求示例 https://ehpc.cn-hangzhou.aliyuncs.com/?Action=SubmitJob&RegionId=cn-hangzhou&ClusterId=<集群ID>&CommandLine=/home/exampleUser/job.sh&RunasUser=exampleUser&RunasUserPassword=<用户密码>&<公共请求参数> 返回示例 XML格式 04F0F334-1335-436C-A1D7-6C044FE73368 1 JSON格式 { "RequestId": "04F0F334-1335-436C-A1D7-6C044FE73368", "JobId": "1" } 错误码 查询E-HPC接口错误码请访问 错误码。更多错误码,请访问 API 错误中心。

    2020-03-23 22:50:23
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云弹性高性能计算E-HPC-云之彼端,是青藏高原 立即下载
阿里云高性能计算 立即下载
HPC高性能计算数据存储解决方案蓝皮书 立即下载