老练的集群管理员告诉你:珍惜生命,使用 E-HPC 批量执行命令

简介:   笔者曾经是一个苦逼的HPC集群管理员,上百个节点的集群安装、配置,机器多了,什么鸟事都遇到,加班加点想起来就一把辛酸泪。直到我用上 E-HPC,一键创建集群,10分钟无人值守自动安装完成,从此生活惬意多了。

  笔者曾经是一个苦逼的HPC集群管理员,上百个节点的集群安装、配置,机器多了,什么鸟事都遇到,加班加点想起来就一把辛酸泪。直到我用上 E-HPC,一键创建集群,10分钟无人值守自动安装完成,从此生活惬意多了。需要扩容机器也只用点点鼠标,泡杯枸杞的功夫,新节点已经安装好并且自动加入调度系统了,齐活。

  最近 E-HPC 新出了一个批量执行命令的功能,我试了下发现很管用,可以省我不少时间。作为集群管理员,平时我也并不轻闲,运维一个HPC集群杂七杂八的事情挺多的,一旦集群规模上去了,看起来简单的任务,真做起来也不简单。打比方说,现在需要在所有计算节点上,安装上telnet软件。

  如果一个年轻的管理员来干,说不定想要 ssh 登录到每一台机器上,然后复制粘贴安装命令。集群规模达到几十台节点,估计就得放弃另想办法了。不过作为一个老练的集群管理员,这点事还难不倒我,以前自然是用 pssh 搞定:

  • 生成一份计算节点列表(别忘了最近扩容过,最好经常更新这个表)

20180902201347.png

  • 运行 pssh 安装软件,加上输出回显并且重定向,这样如果出错可以看日志

    pssh -h hostfile -i -A yum install -y telnet | tee install.log
  • 往回翻日志,或者批量运行另一条检查结果的命令

20180902201854.png

  如果使用 E-HPC 的批量执行命令功能,这个工作就很容易了:E-HPC 控制台上,进入“执行命令”界面,选择“批量执行”功能,勾上计算节点,输入每台节点上要执行的命令,回车,搞定。

20180902181903.png

  “历史命令”页里,每台节点上执行的日志一目了然,不会混在一起:

20180902182521.png

  整个过程没发觉有什么需要特别操心的,节点数量没有限制,超时时间可以自己设置。

  不论是不熟悉系统运维的年轻管理员,还是像笔者一样老练的管理员,都试试 E-HPC 吧,有限的生命,不用再挣扎在繁杂的命令行和机械的操作中了。


  弹性高性能计算(E-HPC)是面向教育科研,企事业单位和个人的一站式公有云HPC服务。E-HPC提供批量执行命令(Clusterun)功能,让用户在web终端上就可以管理大规模HPC集群,完成日常运维工作。
  除了安装软件,您还可以用它修改系统配置、查杀僵尸进程、管理在线用户等等,无限制定制您需要的功能。以前需要登录机器完成的工作,现在都可以在 E-HPC 控制台上,一个命令完成,欢迎试用 https://ehpc.console.aliyun.com

ehpc-console-noname.gif

目录
相关文章
|
调度 弹性计算 存储
拆解超算上云的障碍,阿里云用了这三招|E-HPC如何改变云超算?
2019年阿里云上海峰会,由阿里云资深技术专家何万青带来以“阿里云超算E-HPC平台”为题的演讲。本文内容包括了HPC概念及发展趋势,面向“大计算”设计的弹性基础设施,客户应用云上优化,着重介绍了E-HPC自动伸缩,闲时计算方案与混合云,数据全流程可视化以及HPC工作流与数据迁移等。
1899 0
|
2月前
|
存储 人工智能 弹性计算
产品技术能力飞跃,阿里云E-HPC荣获“CCF 产品创新奖”!
9月24日,在中国计算机学会举办的“2024 CCF 全国高性能计算学术年会”中,阿里云弹性高性能计算(E-HPC)荣获「 CCF HPC China 2024 产品创新奖」。这也是继 2022 年之后,阿里云E-HPC 再次荣获此奖项,代表着阿里云在云超算领域的持续创新结果,其产品能力和技术成果得到了业界的一致认可。
101052 61
|
2月前
|
存储 人工智能 弹性计算
产品技术能力飞跃,阿里云E-HPC荣获“CCF 产品创新奖”!
9月24日,在中国计算机学会举办的“2024 CCF全国高性能计算学术年会”中,阿里云弹性高性能计算(E-HPC)荣获「CCF HPC China 2024产品创新奖」。这也是继2022年之后,阿里云E-HPC再次荣获此奖项,代表着阿里云在云超算领域的持续创新结果,其产品能力和技术成果得到了业界的一致认可。
|
存储 弹性计算 运维
带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案(上)
带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案(上)
388 0
|
存储 弹性计算 运维
带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案(下)
带你读《生命科学行业云上解决方案及最佳实践》——阿里云 E-HPC 生命科学行业整体解决方案(下)
316 0
|
编解码 弹性计算 搜索推荐
阿里云E-HPC+i4p大内存实例,加速寻因生物单细胞数据分析效率
将单细胞测序技术与IT基础设施结合在一起,实现1+1大于2的效果。
阿里云E-HPC+i4p大内存实例,加速寻因生物单细胞数据分析效率
《阿里云弹性高性能计算E-HPC —— 云之彼端,是青藏高原》电子版地址
阿里云弹性高性能计算E-HPC —— 云之彼端,是青藏高原
149 0
《阿里云弹性高性能计算E-HPC —— 云之彼端,是青藏高原》电子版地址
|
存储 弹性计算 安全
如何使用阿里云超算E-HPC实现新冠状病毒高通量药物筛选
高性能计算(High Performance Computing,简称HPC),常被称为“超算”,是现代药物研发必不可少的支持。
3290 0
如何使用阿里云超算E-HPC实现新冠状病毒高通量药物筛选