架构中涉及的模块(补充中)
CMDB
描述
配置管理数据库( Configuration Management Database,CMDB)是一个逻辑数据库,以应用和业务驱动的,需要什么数据,就创造什么数据,通过灵活数据建模,来实现以需求为导向的 CMDB 建设。包含了配置项全生命周期的信息以及配置项之间的关系(包括物理关系、实时通信关系、非实时通信关系和依赖关系)。
通过完善的 Web API 来进行各个流程或应用之间的数据通信,例如:数据上报,验证,获取,更新等等。从而高效控制与管理不断变化的IT基础架构与IT服务,并为其它流程提供准确的配置信息。
简而言之就是可自定义模型可编排的底层数据库,适配客户现场的情况,每个客户的生产环境都不一样,关注点也不一样,可以通过这个根据客户事件情况建模。
功能
资源标准化管理
通过自动和手动方式,将各处分散的资源信息进行标准化处理和整合,维护资源信息及资源间的关联关系,并记录资源信息的变化过程。与服务管理结合,实现资源的流程化、标准化管理。
IT监控与故障分析
维护从底层基础架构到上层业务应用的关联关系,在设备发生故障时,快速分析出对业务造成的影响,从而辅助判断应对措施。也可用于在资源变更前快速判断变更所影响的范围,从而做出相应决策。
自动化运维
与自动化运维工具深度集成,为自动化运维工具提供准确的设备、组件信息,支持自动化部署、故障自愈、DevOps等自动化运维场景。
IT服务管理
基于ITIL理念,与IT服务管理产品结合,将配置项与所有服务支持和服务交付流程深度关联,支撑设备故障、变更、发布等流程的运转。在流程流转中,快速找到当前设备故障、变更引发的关联配置内容,同时依赖于相关流程保证数据的正确性。
安全管理与审计
对资源的变更过程进行跟踪,对操作人员、操作时间、操作类型等审计信息进行准确记录,使所有变更都可追溯、可恢复,满足合规性要求,便于进行安全分析,保障数据安全。
Monitor
描述
轻量化的监控系统,资源占用少,性能高。对iaas、paas、saas层面统一管控。
数据采集免配置: agent自发现、agent主动推送, 任何数据自定义脚本。
支持对单个主机停止报警,多时间段内支持报警升级,最多5个级别的升级。
对接云底座运维工具,ASO/CMS/BCC/TianjiMon等,还有应用及业务监控的对接,Prometheus/EMAS/SLS以及客户侧各种开源工具等。
功能
主要用途是进行监控过滤收敛,自定义监控。
业务监控
通过Agent采集具体的核心业务模块。
应用监控
通过exporte对接服务端的应用,比如JVM、DB、MQ、NGINX等。
基础监控
通过Agent、接口对接生产环境的基础性能指标,比如CPU、Load、MEN、Network、Disk等。
IOT监控
通过Agent、MQTT对接IOT设备,比如摄像头、智能开关、AP、POS等。
集成监控
通过接口对接各种第三方监控,比如云底层监控,第三方软件监控等。
Knowledge Management
描述
知识管理是快速建立其他系统的基本能力,可以说是抓手系统,可以将知识管理系统分成六个子系统,分别是信息搜索系统,信息筛选系统,知识输入系统,加工整理系统,知识输出系统,存储调用系统。可以实现MTTR缩短。
知识管理流程:获取>创造>分类>存储>分享>更新>价值
功能
知识沉淀
利用软件系统或其他工具,对组织中大量的有价值的方案、策划、成果、经验等知识进行分类存储和管理,积累知识资产避免流失。
协同共享
增强员工之间的知识流动,进行多人协同、项目协同、文档共享。
知识应用
提高变更管理问题中的决策效果,提高应对故障的能力,提高员工及业务效率,提供应急预案,快速恢复。
知识赋能
促进知识的学习和培训,以及再利用和创新,比如爬虫系统、大数据应用、智能算法推荐。
Ticket Management
描述
工单系统Ticket system又称为工单管理系统,根据不同的需求,来有针对的管理、维护和追踪一系列的问题和请求。
工单管理系统是为了支撑其它系统而存在的,所以在设计结构时既要考虑工单本身,又需要考虑其他系统。
功能
用来创建、挂起、解决用户提交的事务请求。规范化、统一化和清晰化的处理和管理事务。一个完整的工单系统还需要配套拥有一个帮助文档知识库(Knowledge base),里面包含客户的一些常见受理问题相关信息,常见问题的处理方式,和一些其他的帮助文档等。一个工单系统就像一个问题追踪器,能很清晰的追踪,处理和归档内外的问题事务请求,标准化服务追踪用户,具有批量性、时效性、绩效性的特点。
工单内容
工单页面中主要记录工单信息,和工单关联信息,比如一个工单就需要有发起人、类型、内容、状态等信息,同时提供处理工单相关联的信息。
工单状态
工单在创建好以后,是需要流转的,是需要用状态来标识的。
工单日志
工单从创建到结束有一个过程,工单日志主要记录这个过程以及这个过程中不同人员对工单的操作。比如系统日志、操作记录等。
工单分配
工单创建好以后,会有不同的人员对工单进行处理,需要支持系统分配和人工分配以及SLA升级事件。
工单类型
工单内容记录的是不同业务场景下的问题,在工单系统中以工单类型来区分,比如严重、高危、中危、低危,不同的工单类型有不同的使用场景,会产生不同的处理结果。
处理人员
工单处理人员基于类型进行设置,即不同的工单类型第一处理人不同,通过处理人员设置,系统就可以将工单自动进行分配,同时也可以基于处理人员的设置来进行工单权限的判断,有A类工单处理权限的人员可以在系统中看到A类工单,可以等待系统分配,也可以自动去接工单处理。以及进行日程灵活排班。
处理结果
对处理结果进行记录,记录好以后,触发其他系统的单据或者操作,比如服务效能评价,满意度调查,进而人员考核。
分析报表
通过对工单问题的分析,可以反推业务的优化,通过对工单处理时长的分析,可以对工单SOP进行优化。
更新中......