开发者社区 问答 正文

产品概述

该部分文档将详细介绍如何使用 E-HPC管理控制台对E-HPC集群、节点、用户和共享存储等进行管理,帮助客户深入了解E-HPC的特性和功能。同时开发者也可以通过OpenAPI来管理E-HPC。
如果您需要紧急人工协助,请在 E-HPC管理控制台选择 [backcolor=transparent]工单 > [backcolor=transparent]提交工单,或者 直接提交工单
有关阿里云弹性高性能计算更多的功能说明和定价信息,请登录 E-HPC产品首页进行查询。

声明
本文档中描述的部分产品特性或者服务可能不在您的购买或使用范围之内,请以实际商业合同和条款为准。本文档内容仅作为指导使用,文档中的所有内容不构成任何明示或暗示的担保。由于产品版本升级或其他原因,本文档内容会不定期更新,使用文档时请注意文档配套的软件版本。

展开
收起
反向一觉 2017-10-26 13:34:08 1788 分享 版权
阿里云 AI 助理回答

阿里云弹性高性能计算E-HPC管理指南

产品概述

阿里云弹性高性能计算(E-HPC)旨在为用户提供一个高度可扩展、稳定可靠的高性能计算平台,特别适合需要大量计算资源的科学计算、工程模拟、数据分析等场景。E-HPC通过集成的管理控制台和OpenAPI,让用户能够轻松创建和管理计算集群、配置资源、提交及监控作业,并支持多种存储服务与用户权限管理。

前提条件与准备工作

  • 账号注册与实名认证:确保您已拥有阿里云账号并完成实名认证。
  • 服务开通:在阿里云控制台开通E-HPC服务。
  • 了解费用:参考E-HPC产品首页了解具体功能说明和定价信息。

基本操作步骤

  1. 创建集群

    • 在E-HPC管理控制台快速创建集群,选择合适的镜像、调度器类型、域账号服务及共享存储。
  2. 配置用户与权限

    • 创建NIS或LDAP域账号服务管理用户,分配访问权限和组别。
  3. 管理计算资源

    • 调整节点数量、类型,设置自动伸缩策略,以适应不同负载需求。
    • 使用控制台进行用户管理、节点管理和调度器队列配置。
  4. 提交与监控作业

    • 通过控制台直接编辑提交小型脚本或上传大型作业至OSS后提交。
    • 利用E-HPC优化器监控作业性能,分析运行数据。
  5. 查看作业结果与可视化处理

    • 查询作业状态、时间及详情,使用VNCViewer进行远程可视化访问。

高级功能与配置

  • 远程可视化:提供图形化界面直接处理集群中的作业任务。
  • 性能分析:深入分析集群运行时性能,优化作业执行效率。
  • 自定义镜像与软件部署:根据需求定制镜像,预装特定软件环境。

常见问题与解决方案

  • 地域创建限制:若无法创建集群,请检查地域资源支持情况或尝试其他地域。
  • SSH登录问题:遇到登录失败时,需检查网络、安全组规则、防火墙设置等。

最佳实践与优化建议

  • 根据作业特性选择合适的实例类型和数量,利用自动伸缩提高资源利用率。
  • 利用ECS实例与E-HPC集群同VPC内私网通信,简化网络配置。

参考资料与文档链接

  • E-HPC官方文档提供了详细的操作指南和FAQ,包括集群管理、作业提交、性能优化等内容。

重要提醒

  • 注意操作系统版本的选择与维护,避免使用已结束生命周期的版本。
  • 操作E-HPC集群节点时,应仅通过E-HPC控制台进行,避免使用ECS管理控制台导致集群异常。

请根据实际需求,结合E-HPC管理控制台和OpenAPI灵活管理您的高性能计算资源。如遇紧急问题,可通过控制台提交工单获取人工协助。


此回答综合了参考资料中的关键信息,旨在为您提供全面且实用的E-HPC管理指南。

有帮助
无帮助
AI 助理回答生成答案可能存在不准确,仅供参考
0 条回答
写回答
取消 提交回答