「IT运维」集成和自动化的平台 StackStorm概述

简介: 「IT运维」集成和自动化的平台 StackStorm概述

关于

StackStorm是一个用于跨服务和工具进行集成和自动化的平台。它将您现有的基础结构和应用程序环境联系在一起,这样您就可以更容易地自动化该环境。它特别关注在事件发生后采取的行动。

StackStorm帮助自动化常见的操作模式。一些例子:

  • 方便的故障诊断——触发Nagios、senu、New Relic和其他监控系统捕获的系统故障,对物理节点、OpenStack或Amazon实例和应用程序组件进行一系列诊断检查,并将结果发布到共享的通信上下文,如HipChat或JIRA。
  • 自动修复——识别和验证OpenStack计算节点上的硬件故障,适当地疏散实例,并向管理员发送关于潜在停机时间的电子邮件,但如果出现任何问题——冻结工作流并调用PagerDuty唤醒人工。
  • 持续部署——使用Jenkins构建和测试,提供一个新的AWS集群,使用负载均衡器打开一些流量,并根据NewRelic的应用程序性能数据进行前滚或后滚。

StackStorm帮助您将这些和其他操作模式组合为规则和工作流或操作。这些规则和工作流(StackStorm平台内的内容)被存储为代码,这意味着它们支持与现在用于代码开发的协作方法相同的方法。它们可以与更广泛的开源社区共享,例如通过StackStorm社区。

工作原理


StackStorm通过可扩展的包含传感器和操作的适配器集插入到环境中。

  1. 传感器是Python插件,用于接收或监视事件的入站或出站集成。当来自外部系统的事件发生并由传感器处理时,将向系统发出StackStorm触发器。
  2. 触发器是外部事件的StackStorm表示。有通用触发器(如计时器、网络挂钩)和集成触发器(如senu alert、JIRA issue updated)。可以通过编写传感器插件来定义新的触发器类型。
  3. 操作是StackStorm出站集成。有通用操作(ssh、REST调用)、集成(OpenStack、Docker、Puppet)或自定义操作。操作可以是Python插件,也可以是任何脚本,都可以通过添加几行元数据在StackStorm中使用。用户可以通过CLI或API直接调用操作,或者作为规则和工作流的一部分使用和调用操作。
  4. 规则将触发器映射到操作(或工作流),应用匹配标准并将触发器有效负载映射到操作输入。
  5. 工作流将操作缝在一起形成“超级操作”,定义顺序、转换条件并传递数据。大多数自动化操作不止一步,因此需要多个操作。工作流与“原子”操作一样,可以在操作库中使用,可以手动调用或由规则触发。
  6. 包是内容部署的单元。它们通过分组集成(触发器和操作)和自动化(规则和工作流)简化了StackStorm可插内容的管理和共享。越来越多的包可用于StackStorm交换。用户可以创建自己的包,在Github上共享它们,或者提交到StackStorm Exchange。
  7. 动作执行的审计跟踪,手动或自动,记录和存储触发上下文和执行结果的完整细节。它还被捕获在审计日志中,以便与外部日志和分析工具集成:LogStash、Splunk、statsd、syslog。

StackStorm是一个具有模块化架构的服务。它由通过消息总线通信的松散耦合的服务组件组成,并水平扩展以按比例交付自动化。StackStorm有一个Web UI,一个CLI客户端,当然还有一个完整的REST API。我们还提供了Python客户端绑定,以简化开发人员的工作。

StackStorm是一个新产品,正在积极开发中。我们非常渴望参与社区,获得反馈并完善我们的方向。

相关文章
|
3天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI在IT基础设施管理中的应用
【6月更文挑战第24天】本文将深入探讨人工智能(AI)如何革新传统IT运维模式,提升效率与响应速度。通过分析AI技术在故障预测、自动化处理和安全防护等方面的应用实例,揭示其对现代IT基础设施管理的深远影响。文章旨在为读者提供一个关于AI赋能运维领域的全面视角,同时指出实施过程中可能遇到的挑战与对策。
26 5
|
6天前
|
人工智能 运维 监控
智能化运维:AI在IT运维中的应用与挑战
【6月更文挑战第21天】本文将深入探讨AI技术如何革新传统的IT运维领域,通过案例分析展示AI在故障预测、自动化处理和安全监控等方面的应用。同时,文章也将讨论AI运维带来的挑战,包括数据隐私、系统复杂性和成本问题,并提出相应的解决策略。
189 6
|
7天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:AI在IT管理中的角色与挑战
随着人工智能技术的不断进步,智能运维(AIOps)正逐渐改变传统IT运维的面貌。本文将深入探讨AI在IT运维中的应用、面临的挑战以及未来发展趋势,为读者呈现一个全面而深入的智能运维世界。
|
6天前
|
机器学习/深度学习 人工智能 运维
智能化运维的崛起:AI在IT管理中的应用与挑战
【6月更文挑战第21天】随着人工智能(AI)技术的飞速发展,其在信息技术(IT)运维领域的应用已成为推动效率和创新的关键动力。本文将深入探讨AI如何重塑IT运维的面貌,包括自动化故障检测、预测性维护、以及智能决策支持等方面。同时,我们也将分析在实施智能化运维时所面临的技术挑战和道德考量,并提出相应的解决策略。
310 4
|
3天前
|
机器学习/深度学习 运维 监控
智能化运维的崛起:机器学习在IT运维中的应用与挑战
本文将深入探讨如何通过机器学习技术提升IT运维的效率和准确性,分析其在故障预测、自动化处理及安全监控方面的应用实例,并讨论实施过程中可能遇到的技术与管理挑战。
9 0
|
4天前
|
机器学习/深度学习 运维 安全
自动化运维在现代IT架构中的应用与挑战
【6月更文挑战第23天】随着云计算和微服务架构的兴起,自动化运维成为保障系统稳定性、提升效率的关键。本文探讨了自动化运维在现代IT环境中的实践方法、面临的挑战以及未来的发展趋势,旨在为运维人员提供策略指导和技术参考。
9 0
|
1月前
|
运维 Linux 程序员
最全树莓派4B安装64位Linux(不用显示器键盘鼠标),Linux运维面试送分题
最全树莓派4B安装64位Linux(不用显示器键盘鼠标),Linux运维面试送分题
最全树莓派4B安装64位Linux(不用显示器键盘鼠标),Linux运维面试送分题
|
25天前
|
运维 Linux Shell
运维:Linux服务器崩了怎么办,快来看看这份”急救命令指南“吧!
当服务器出现问题,如崩溃、内存耗尽或CPU使用率过高时,运维工程师需要保持冷静,并通过一系列Shell命令来诊断和解决。首先,检查是否有异常SSH登录活动,查看`/etc/passwd`和`.bash_history`文件,以及用户最近的登录信息。接着,监控网络连接和端口,使用`netstat`和`lsof`命令找出资源占用高的进程,并查看进程启动时间和详细信息。同时,排查可能的恶意文件,检查定时任务和服务配置以确保没有异常启动项。最后,分析系统日志,如`/var/log`目录下的各种日志文件,找出潜在问题。通过这些步骤,可以有效定位和解决服务器故障。
|
1月前
|
消息中间件 运维 Linux
运维最全Linux 命令大全之scp命令_linux scp 指令(1),2024年最新从消息中间件看分布式系统的多种套路
运维最全Linux 命令大全之scp命令_linux scp 指令(1),2024年最新从消息中间件看分布式系统的多种套路
|
1月前
|
运维 Linux Docker
ChatGLM3在Docker环境部署,Linux运维免打包多渠道统计如何实现
ChatGLM3在Docker环境部署,Linux运维免打包多渠道统计如何实现