微软私有云自动化的完美演示

简介:

在微软私有云解决方案里,System Center是重要一环。System Center的各大组件类似于三权分立:SCSM是立法和审判机构(服务请求与审核),SCOM是监察机构(监控数据中心的性能和事件),而Orchestrator则是执法机构(负责驱动底层的组件)。

在盆盆录制的这段视频里,描述了这样一段场景,分布式应用的Web前端过载时,会触发runbook新建变更请求;领导批准后,会触发另一个runbook,或者新建结点以横向扩展/或者启动池中可用的节点,以应对业务系统访问量暴涨。

其中最关键的地方就是Orchestrator的Runbook,它可以根据SCOM监控的性能警报自动执行复杂的操作,以下是视频中所示的runbook。

2

由于视频里所示的demo相对复杂,需要引入SCSM,所以该runbook中的初始化数据更新RB活动这两个Activity都和SCSM有关。

为方便描述,我们将该runbook略作修改,如附图所示:

3

该runbook可以实现的功能如下:

  • 从SCOM中获取Web前端的报警
  • 根据SCOM警报中的源虚机名称,得出其所在的计算机层的名称
  • 在该计算机层中,寻找是否有未启动的虚机
  • 如果有,则启动该虚机
  • 如果没有,则对该计算机层执行scale-out

这里着重描述几个关键的Activity(括号内是来自VMM IP中的实际Activity Name): 

获取Web层信息(Get Tier) 

4

根据Member VM Instance Names来倒推计算机层的名称,如附图所示:

5

其中的Value采用了Orchestrator独特的所谓databus的技术,我们可以右键单击,选择订阅前几个Activity所发布的数据。在活动一栏,选择第一个Activity(监控Web前端报警),然后选择其所发布的数据NetbiosComputerName。这表明我们根据SCOM警报中显示的源计算机的名称,来查询其计算机层的名称。这样我们就无需在runbook里采用硬编码,而根据前面Activity发布的动态数据作为变量,十分方便。

6 

Web层有否未启动VM(Get VM) 

查到该虚机所在Web层名称,就可以查询该计算机层中是否有未启动的虚机。

7 

查询参数有两个:Comuter Tier和Status,表示所在的计算机层和运行状态。返回同时满足这两个条件的虚机。 

其中Computer Tier的值可以订阅前一个Activity(获取Web层信息)发布在Databus上的数据(Tier Name)。 

Status的值可以选择正在运行(注意中文版的VMM,必须输入正在运行,英文版的话,应该选择running)。 

判断分支 

如果实现后续的判断分支?我们无需编写代码(尽管runbook可以直接使用powershell或者代码)。我们别小看活动之间的连接线(smart link),这些连接线也可以进行自定义!

例如当Web层有否未启动VM返回空值时(下方的分支),我们将连接线的属性值配置为返回对象数等于0。 

8 

包括部分,单击添加,然后设置已发布数据Number of Objects  

9  

设置条件表达式为等于数据值可以填0 

同理设置上方的分支为Number of Objects大于0 

10  

发送电子邮件   

Runbook执行成功后,会自动发送电子邮件,报告给指定的人员,告知哪台虚机发生性能问题,并且已经执行了解决措施。 

更有意思的是,邮件正文里涉及到的故障主机,也可以订阅databus上的数据! 

11




本文转自 ahpeng 51CTO博客,原文链接:http://blog.51cto.com/markwin/1132830,如需转载请自行联系原作者

相关文章
|
监控 数据安全/隐私保护 测试技术
|
1月前
|
机器学习/深度学习 人工智能 运维
构建高效运维体系:从自动化到智能化的演进
本文探讨了如何通过自动化和智能化手段,提升IT运维效率与质量。首先介绍了自动化在简化操作、减少错误中的作用;然后阐述了智能化技术如AI在预测故障、优化资源中的应用;最后讨论了如何构建一个既自动化又智能的运维体系,以实现高效、稳定和安全的IT环境。
61 4
|
1月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
48 4
|
9天前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
智能化运维:机器学习在故障预测和自动化响应中的应用
28 4
|
1月前
|
运维 jenkins 持续交付
自动化部署的魅力:如何用Jenkins和Docker简化运维工作
【10月更文挑战第7天】在现代软件开发周期中,快速且高效的部署是至关重要的。本文将引导你理解如何使用Jenkins和Docker实现自动化部署,从而简化运维流程。我们将从基础概念开始,逐步深入到实战操作,让你轻松掌握这一强大的工具组合。通过这篇文章,你将学会如何利用这些工具来提升你的工作效率,并减少人为错误的可能性。
|
1月前
|
运维 Prometheus 监控
运维中的自动化实践每月一次的系统维护曾经是许多企业的噩梦。不仅因为停机时间长,更因为手动操作容易出错。然而,随着自动化工具的引入,这一切正在悄然改变。本文将探讨自动化在IT运维中的重要性及其具体应用。
在当今信息技术飞速发展的时代,企业对系统的稳定性和效率要求越来越高。传统的手动运维方式已经无法满足现代企业的需求。自动化技术的引入不仅提高了运维效率,还显著降低了出错风险。本文通过几个实际案例,展示了自动化在IT运维中的具体应用,包括自动化部署、监控告警和故障排除等方面,旨在为读者提供一些实用的参考。
|
1月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
【10月更文挑战第1天】智能化运维:机器学习在故障预测和自动化响应中的应用
66 3
|
1月前
|
机器学习/深度学习 运维 监控
构建高效运维体系:从自动化到智能化的演进之路
在当今数字化时代,运维工作的重要性日益凸显。随着企业业务的不断扩展和技术的日新月异,传统的运维方式已难以满足现代企业的需求。因此,构建一个高效、智能的运维体系成为了企业发展的关键。本文将探讨如何从自动化逐步演进到智能化,以实现运维工作的高效化和智能化。
|
1月前
|
机器学习/深度学习 运维 监控
构建高效运维体系:从自动化到智能化的演进之路
在当今数字化浪潮中,运维作为信息技术的重要支柱,其重要性日益凸显。本文将探讨如何通过自动化和智能化手段,提升运维效率,保障系统稳定性,促进业务持续发展。