业务连续性解决方案架构(上)

简介: 在多平台、多应用的场景下,如何保障业务连续性成为运维人员以及公司的考虑重点,本文主要梳理影响业务连续性的各个方面以及所需的模块。(CMDB、Monitor、KM、TM)

架构中涉及的模块(补充中)


CMDB


描述


配置管理数据库( Configuration Management Database,CMDB)是一个逻辑数据库,以应用和业务驱动的,需要什么数据,就创造什么数据,通过灵活数据建模,来实现以需求为导向的 CMDB 建设。包含了配置项全生命周期的信息以及配置项之间的关系(包括物理关系、实时通信关系、非实时通信关系和依赖关系)。

通过完善的 Web API 来进行各个流程或应用之间的数据通信,例如:数据上报,验证,获取,更新等等。从而高效控制与管理不断变化的IT基础架构与IT服务,并为其它流程提供准确的配置信息。

简而言之就是可自定义模型可编排的底层数据库,适配客户现场的情况,每个客户的生产环境都不一样,关注点也不一样,可以通过这个根据客户事件情况建模。


功能


资源标准化管理

      通过自动和手动方式,将各处分散的资源信息进行标准化处理和整合,维护资源信息及资源间的关联关系,并记录资源信息的变化过程。与服务管理结合,实现资源的流程化、标准化管理。


IT监控与故障分析

维护从底层基础架构到上层业务应用的关联关系,在设备发生故障时,快速分析出对业务造成的影响,从而辅助判断应对措施。也可用于在资源变更前快速判断变更所影响的范围,从而做出相应决策。


自动化运维

与自动化运维工具深度集成,为自动化运维工具提供准确的设备、组件信息,支持自动化部署、故障自愈、DevOps等自动化运维场景。


IT服务管理

基于ITIL理念,与IT服务管理产品结合,将配置项与所有服务支持和服务交付流程深度关联,支撑设备故障、变更、发布等流程的运转。在流程流转中,快速找到当前设备故障、变更引发的关联配置内容,同时依赖于相关流程保证数据的正确性。


安全管理与审计

对资源的变更过程进行跟踪,对操作人员、操作时间、操作类型等审计信息进行准确记录,使所有变更都可追溯、可恢复,满足合规性要求,便于进行安全分析,保障数据安全。



Monitor


描述


轻量化的监控系统,资源占用少,性能高。对iaas、paas、saas层面统一管控。

数据采集免配置: agent自发现、agent主动推送, 任何数据自定义脚本。

支持对单个主机停止报警,多时间段内支持报警升级,最多5个级别的升级。

对接云底座运维工具,ASO/CMS/BCC/TianjiMon等,还有应用及业务监控的对接,Prometheus/EMAS/SLS以及客户侧各种开源工具等。


功能


主要用途是进行监控过滤收敛,自定义监控。


业务监控

通过Agent采集具体的核心业务模块。


应用监控

通过exporte对接服务端的应用,比如JVM、DB、MQ、NGINX等。


基础监控

通过Agent、接口对接生产环境的基础性能指标,比如CPU、Load、MEN、Network、Disk等。


IOT监控

通过Agent、MQTT对接IOT设备,比如摄像头、智能开关、AP、POS等。


集成监控

通过接口对接各种第三方监控,比如云底层监控,第三方软件监控等。



Knowledge Management


描述


知识管理是快速建立其他系统的基本能力,可以说是抓手系统,可以将知识管理系统分成六个子系统,分别是信息搜索系统,信息筛选系统,知识输入系统,加工整理系统,知识输出系统,存储调用系统。可以实现MTTR缩短。

知识管理流程:获取>创造>分类>存储>分享>更新>价值


功能


知识沉淀

利用软件系统或其他工具,对组织中大量的有价值的方案、策划、成果、经验等知识进行分类存储和管理,积累知识资产避免流失。


协同共享

增强员工之间的知识流动,进行多人协同、项目协同、文档共享。


知识应用

提高变更管理问题中的决策效果,提高应对故障的能力,提高员工及业务效率,提供应急预案,快速恢复。


知识赋能

促进知识的学习和培训,以及再利用和创新,比如爬虫系统、大数据应用、智能算法推荐。



Ticket Management


描述


工单系统Ticket system又称为工单管理系统,根据不同的需求,来有针对的管理、维护和追踪一系列的问题和请求。

工单管理系统是为了支撑其它系统而存在的,所以在设计结构时既要考虑工单本身,又需要考虑其他系统。


功能


用来创建、挂起、解决用户提交的事务请求。规范化、统一化和清晰化的处理和管理事务。一个完整的工单系统还需要配套拥有一个帮助文档知识库(Knowledge base),里面包含客户的一些常见受理问题相关信息,常见问题的处理方式,和一些其他的帮助文档等。一个工单系统就像一个问题追踪器,能很清晰的追踪,处理和归档内外的问题事务请求,标准化服务追踪用户,具有批量性、时效性、绩效性的特点。


工单内容

工单页面中主要记录工单信息,和工单关联信息,比如一个工单就需要有发起人、类型、内容、状态等信息,同时提供处理工单相关联的信息。


工单状态

工单在创建好以后,是需要流转的,是需要用状态来标识的。


工单日志

工单从创建到结束有一个过程,工单日志主要记录这个过程以及这个过程中不同人员对工单的操作。比如系统日志、操作记录等。


工单分配

工单创建好以后,会有不同的人员对工单进行处理,需要支持系统分配和人工分配以及SLA升级事件。


工单类型

工单内容记录的是不同业务场景下的问题,在工单系统中以工单类型来区分,比如严重、高危、中危、低危,不同的工单类型有不同的使用场景,会产生不同的处理结果。


处理人员

工单处理人员基于类型进行设置,即不同的工单类型第一处理人不同,通过处理人员设置,系统就可以将工单自动进行分配,同时也可以基于处理人员的设置来进行工单权限的判断,有A类工单处理权限的人员可以在系统中看到A类工单,可以等待系统分配,也可以自动去接工单处理。以及进行日程灵活排班。


处理结果

对处理结果进行记录,记录好以后,触发其他系统的单据或者操作,比如服务效能评价,满意度调查,进而人员考核。


分析报表

通过对工单问题的分析,可以反推业务的优化,通过对工单处理时长的分析,可以对工单SOP进行优化。



更新中......

目录
相关文章
|
3天前
|
传感器 算法 物联网
智能停车解决方案之停车场室内导航系统(二):核心技术与系统架构构建
随着城市化进程的加速,停车难问题日益凸显。本文深入剖析智能停车系统的关键技术,包括停车场电子地图编辑绘制、物联网与传感器技术、大数据与云计算的应用、定位技术及车辆导航路径规划,为读者提供全面的技术解决方案。系统架构分为应用层、业务层、数据层和运行环境,涵盖停车场室内导航、车位占用检测、动态更新、精准导航和路径规划等方面。
27 4
|
15天前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
51 1
|
30天前
|
运维 Serverless 数据处理
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
Serverless架构通过提供更快的研发交付速度、降低成本、简化运维、优化资源利用、提供自动扩展能力、支持实时数据处理和快速原型开发等优势,为图像处理等计算密集型应用提供了一个高效、灵活且成本效益高的解决方案。
57 3
|
2月前
|
存储 监控 数据可视化
SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
【9月更文挑战第2天】SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
150 9
|
3月前
|
Serverless
解决方案评测|《Serverless高可用架构》获奖名单
解决方案评测|《Serverless高可用架构》获奖名单正式公布!!
154 1
|
3月前
|
数据挖掘 关系型数据库 MySQL
Serverless高可用架构的解决方案体验
Serverless高可用架构的解决方案体验
160 6
|
3月前
|
机器学习/深度学习 分布式计算 Cloud Native
云原生架构下的高性能计算解决方案:利用分布式计算资源加速机器学习训练
【8月更文第19天】随着大数据和人工智能技术的发展,机器学习模型的训练数据量和复杂度都在迅速增长。传统的单机训练方式已经无法满足日益增长的计算需求。云原生架构为高性能计算提供了新的可能性,通过利用分布式计算资源,可以在短时间内完成大规模数据集的训练任务。本文将探讨如何在云原生环境下搭建高性能计算平台,并展示如何使用 PyTorch 和 TensorFlow 这样的流行框架进行分布式训练。
126 2
|
5天前
|
缓存 负载均衡 JavaScript
探索微服务架构下的API网关模式
【10月更文挑战第37天】在微服务架构的海洋中,API网关犹如一座灯塔,指引着服务的航向。它不仅是客户端请求的集散地,更是后端微服务的守门人。本文将深入探讨API网关的设计哲学、核心功能以及它在微服务生态中扮演的角色,同时通过实际代码示例,揭示如何实现一个高效、可靠的API网关。
|
3天前
|
Cloud Native 安全 数据安全/隐私保护
云原生架构下的微服务治理与挑战####
随着云计算技术的飞速发展,云原生架构以其高效、灵活、可扩展的特性成为现代企业IT架构的首选。本文聚焦于云原生环境下的微服务治理问题,探讨其在促进业务敏捷性的同时所面临的挑战及应对策略。通过分析微服务拆分、服务间通信、故障隔离与恢复等关键环节,本文旨在为读者提供一个关于如何在云原生环境中有效实施微服务治理的全面视角,助力企业在数字化转型的道路上稳健前行。 ####
|
4天前
|
Dubbo Java 应用服务中间件
服务架构的演进:从单体到微服务的探索之旅
随着企业业务的不断拓展和复杂度的提升,对软件系统架构的要求也日益严苛。传统的架构模式在应对现代业务场景时逐渐暴露出诸多局限性,于是服务架构开启了持续演变之路。从单体架构的简易便捷,到分布式架构的模块化解耦,再到微服务架构的精细化管理,企业对技术的选择变得至关重要,尤其是 Spring Cloud 和 Dubbo 等微服务技术的对比和应用,直接影响着项目的成败。 本篇文章会从服务架构的演进开始分析,探索从单体项目到微服务项目的演变过程。然后也会对目前常见的微服务技术进行对比,找到目前市面上所常用的技术给大家进行讲解。
14 1
服务架构的演进:从单体到微服务的探索之旅