批量在多台ECS内执行命令的最佳实践

本文涉及的产品
系统运维管理,不限时长
简介: 阿里云的客户远程在ECS内部执行命令是最常见的运维操作之一了,比如在ECS内安装卸载软件,启动停止某个进程,等等。很多情况下,还需要对一个ECS列表中的多台ECS,统一的执行某个相同的命令并汇聚执行的结果。

背景与痛点

阿里云的客户远程在ECS内部执行命令是最常见的运维操作之一了,比如在ECS内安装卸载软件,启动停止某个进程,等等。很多情况下,还需要对一个ECS列表中的多台ECS,统一的执行某个相同的命令并汇聚执行的结果。

一个可行的方案是利用SSH远程连接到ECS上执行命令,但是开放ECS的SSH端口给internet访问是危险的。客户可以通过自建跳板机来间接访问ECS以解决安全性的问题,但是这带来了复杂度和成本的上升。

Ansible是业界比较流行的开源的运维工具,但是其认证是独立于阿里云的账号体系之外的,无法通过阿里云的官方工具进行权限控制,其操作记录也无法在阿里云上进行审计。

如果用户使用的是Windows版本的ECS,虽然可以利用PowerShell远程执行命令,但是配置和维护过程更加困难。

在此,我们向大家推荐阿里云官方的批量在多台ECS内执行命令的最佳实践:运维编排服务OOS+云助手。云助手提供了在ECS内执行命令的原子能力,运维编排服务OOS则附加了更丰富的批量、定时、事件驱动、自定义模板等能力,两者结合,可以让ECS运维工作变得既安全又简单高效。

准备工作

准备工作只有两个简单步骤。

首先,请访问运维编排OOS的控制台点一下“立即开通”按钮完成服务的开通。这是一个免费服务,请放心开通。

https://oos.console.aliyun.com/

_2019_10_14_6_11_28

开通之后,请确保您已安装和配置了阿里云命令行工具CLI,且版本号大于等于 3.0.19。该CLI在Github上的下载链接为:https://github.com/aliyun/aliyun-cli/releases

开始执行

我们直接先看一个例子,我要针对cn-beijing地域的["i-1234","i-5678"]这两台远程Linux ECS,执行“echo 123”这个shell命令,我只需要在我本地的shell终端里,输入命令:

ali-xxxxxx:~ shengbo$ aliyun oos StartExecution --region cn-beijing --TemplateName ACS-ECS-BulkyRunCommand --Parameters '{"commandType":"RunShellScript", "commandContent":"echo 123",  "targets":{"Type":"ResourceIds", "ResourceIds":["i-1234","i-5678"]}, "rateControl":{"maxErrors":0,"mode":"Concurrency"}, "OOSAssumeRole":"" }'

简单解释一下上面这个命令,它调用了oos的StartExecution的API,启动官方提供的公共模板ACS-ECS-BulkyRunCommand,传入包含了ECS实例列表(ResourceIds)和执行内容(commandContent)的参数。

该命令会返回一个json结构,如果你能找到"ExecutionId": "exec-xxxxx", 那么恭喜你,你指定的命令已经开始在远程执行了。

屏幕快照 2019-10-14 下午7.25.30.png

请记录下ExecutionId,然后作为参数输入到下面的ListExecutions命令查询执行的过程和结果:

ali-6c96cfde303d:~ shengbo$ aliyun oos ListExecutions --region cn-beijing --ExecutionId exec-xxxx

如果命令正在运行中,你会看到类似如下的结果,Status是“running”。TotalTasks是总的命令数,SuccessTasks是已经执行成功的命令数。两个数字的差,就是还待执行的命令数。

_2019_10_14_7_44_04

你可以多次执行同样的ListExecutions命令进行查看,直到看到Outputs表示整个命令的结果,对于本例,为两台ECS上的标准输出:

_2019_10_14_7_39_51

进阶-自定义模板

在上面的例子里,命令的参数有点过于复杂,其实我可以自定义模板把参数固定下来,让执行的命令变得格外简单。

自定义模板的命令如下,你可以根据自己的需要进行改写:

aliyun oos CreateTemplate --region cn-beijing --TemplateName sample123 --Content '{

"FormatVersion": "OOS-2019-06-01",

"Tasks": [

{

"Name": "runCommand",

"Action": "ACS::ECS::RunCommand",

"Properties": {

"commandContent": "echo 1234",

"instanceId": "{{ ACS::TaskLoopItem }}",

"commandType": "RunShellScript"

},

"Loop": {

"Items": [

"i-1234",

"i-5678"

],

"Outputs": {

"commandOutputs": {

"AggregateType": "Fn::ListJoin",

"AggregateField": "commandOutput"

}

}

},

"Outputs": {

"commandOutput": {

"Type": "String",

"ValueSelector": "invocationOutput"

}

}

}

],

"Outputs": {

"commandOutputs": {

"Type": "List",

"Value": "{{ runCommand.commandOutputs }}"

}

}

}'

今后,你只需要执行如下命令就可以完成和前面一样的效果了

ali-6c96cfde303d:~ shengbo$ aliyun oos StartExecution --region cn-beijing --TemplateName sample123 --Parameters '{}'

此命令调用oos的StartExecution这个API,执行sample123这个自定义模板,不需要额外传入参数。

当然,前面用CLI所做的一切操作,都可以在OOS控制台用白屏化的方式执行,链接为:

https://oos.console.aliyun.com/

了解更多

运维编排OOS是阿里云的运维自动化平台,适用于批量、定时、事件驱动、跨区域运维等场景,除了在ECS内执行命令外,还可以完成ECS创建释放,启停,变配,网络带宽升级,挂载云盘等等各种操作。

如果想了解更多,加入钉钉群“运维编排OOS支持群”,群号23330931。我们会有值班人员在线支持。

OOS管理控制台的链接:https://oos.console.aliyun.com
OOS帮助文档的链接 https://help.aliyun.com/product/119529.html

相关实践学习
借助OSS搭建在线教育视频课程分享网站
本教程介绍如何基于云服务器ECS和对象存储OSS,搭建一个在线教育视频课程分享网站。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
目录
相关文章
|
3月前
|
缓存 监控 Java
Java Socket编程最佳实践:优化客户端-服务器通信性能
【6月更文挑战第21天】Java Socket编程优化涉及识别性能瓶颈,如网络延迟和CPU计算。使用非阻塞I/O(NIO)和多路复用技术提升并发处理能力,减少线程上下文切换。缓存利用可减少I/O操作,异步I/O(AIO)进一步提高效率。持续监控系统性能是关键。通过实践这些策略,开发者能构建高效稳定的通信系统。
104 1
|
14天前
|
安全 Ubuntu 应用服务中间件
Web服务器安全最佳实践
【8月更文第28天】随着互联网的发展,Web服务器成为了企业和组织的重要组成部分。然而,这也使得它们成为黑客和恶意软件的目标。为了确保数据的安全性和系统的稳定性,采取适当的安全措施至关重要。本文将探讨一系列保护Web服务器的最佳策略和技术,并提供一些实用的代码示例。
35 1
|
3月前
|
Linux 调度
路由管家指南:服务器中路由命令的完全解读
路由管家指南:服务器中路由命令的完全解读
42 2
|
3月前
|
Linux
【Linux】一条命令,转发所有请求到另一台服务器上 -高级技巧
【Linux】一条命令,转发所有请求到另一台服务器上 -高级技巧
46 0
|
21天前
|
存储 运维 监控
数据库服务器运维最佳实践
【8月更文挑战第22天】
32 2
数据库服务器运维最佳实践
|
14天前
|
缓存 NoSQL 数据库
Web服务器与数据库优化:提升系统性能的最佳实践
【8月更文第28天】在现代的Web应用中,Web服务器与后端数据库之间的交互是至关重要的部分。优化这些组件及其相互作用可以显著提高系统的响应速度、吞吐量和可扩展性。本文将探讨几种常见的优化策略,并提供一些具体的代码示例。
30 1
|
15天前
|
Shell 网络安全 数据安全/隐私保护
使用 Python 远程登陆服务器的最佳实践
使用 Python 远程登陆服务器的最佳实践
|
16天前
|
缓存 运维 监控
打造稳定高效的数据引擎:数据库服务器运维最佳实践全解析
打造稳定高效的数据引擎:数据库服务器运维最佳实践全解析
|
2月前
|
弹性计算 数据可视化 Linux
云服务器 ECS产品使用问题之执行命令时出现 "command not found" ,该如何解决
云服务器ECS(Elastic Compute Service)是各大云服务商阿里云提供的一种基础云计算服务,它允许用户租用云端计算资源来部署和运行各种应用程序。以下是一个关于如何使用ECS产品的综合指南。
|
4月前
|
弹性计算 运维 Java
最佳实践:阿里云倚天ECS在千寻位置时空智能服务的规模化应用
阿里云、平头哥及安谋科技联合举办的飞天技术沙龙探讨了倚天Arm架构在业务创新中的应用。活动中,千寻位置运维专家分享了将核心业务迁移到倚天处理器ECS实例的成功案例,强调了倚天处理器的高能效比和降本增效优势。迁移过程涉及操作系统、CICD系统和监控系统的适配,以及业务系统的性能测试。目前,千寻已迁移了上千台ECS实例到倚天处理器,实现了成本和效率的显著提升。未来计划继续扩展倚天处理器在核心业务和K8S中的应用。

热门文章

最新文章