基于企业IT设施集中化、管理扁平化、协作一体化的需求,运维一体化平台的目标是建设覆盖运维全生命周期的一站式平台,支撑持续快速交付高质量的系统,提升运维效率,保障业务连续性,实现数字化运维一体化管理,打造支撑数字化转型的智慧中台,加速IT能力升级和组织能力升级。
一、平台能力要求
1、升级运维保障能力
构建自动化、智能化和自主可控的IT运维管理体系,基于场景式的运维保障需求,联动各个运维领域功能模块,实现服务快速交付、故障自动处理、场景全面覆盖、经验智能沉淀的自生长运维管理体系。
2、持续运营及改进信息化业务
构建基于数据与智能的持续运营体系,对研发运维效能进行画像,并基于业务场景和数据能力,辅助业务运营,增强用户体验、改善产品运营。
3、高效协同,打造敏捷精益化IT组织
基于流程、组织、工具的联动,实现“交付-运维-运营”的全流程闭环管理,提高企业运维效率和运营价值,助力市场竞争与应变。
二、“平台+应用”模式
打造承载所有运维和运营功能的统一平台,平台具备资源接入层、运维服务能力和可承载自定义开发应用的能力,平台具备强大的延展性和服务支撑性。将所需的运维功能进行场景化,以工具化的方式运行在统一平台上,调用底层平台所提供的能力服务,实现功能敏捷迭代,功能之间不再以烟囱式方式构建。
1、平台能力池
构建一体化运维平台所需的平台能力包括采控、配置管理、作业执行、运维大数据平台、AI运维和开发框架,并能支持第三方运维系统成为平台能力池的模块,平台能力可以持续扩展,满足新技术和架构要求。
2、场景式交付
解决配置管理、监控及故障自愈、自动化运维、数据化分析等场景应用,提升企业运维效率和IT服务敏捷性,自动化平台与监控互动形成故障自愈,与流程互动形成工单自处理,与CMDB互动实现配置的动态实时更新。
3、插拔式系统
平台化能力及场景应用之间采用松耦合架构,同时将自定义开发场景所需的公共功能进行服务化和模块化设计,并沉淀于平台中,按标准ESB(Enterprise Service Bus,企业服务总线)模式统一提供给应用功能开发,这样平台化的能力模块和场景应用均可插拔式扩展,做到松耦合。
三、IT运维功能全覆盖
IT运维功能涵盖企业现有资产配置管理、基础设施监控、应用监控、服务管理、安全监测、IT呼叫、设施巡检等功能,同时需要为未来自动化、智能化运维场景预留扩展能力,构建监、管、控、服、智、营于一体的运维管理。
1、监:可视化运维
结合ITIL和DevOps实现全面可视化运维、监控平台全方位展示业务健康状态、Web拨测、日志异常告警,并与第三方告警源对接,实现自动故障自愈。
2、管:标准化运维
标准化运维制度、流程规范、产品选型、安全基线、资产管理、CMDB平台,并通过平台管控能力进行约束执行。
3、控:智能化管控
应用日常运维自动化、发布变更自动化、智能扩缩容、批量巡检、补丁更新、安全加固、服务启停、变更发布等自动化运维场景。
4、服:服务化管理
利用可编排的全数据流程引擎,根据实际场景需求自定义专属请求、故障、事件、问题等管理实践,持续建设知识库,优化协作效率,提升客户服务满意度。
5、智:智能化分析
基于运营大数据趋势分析和AI智能化分析,为企业单位运营提供数据支撑和指引,包括办事流程优化、趋势预测、运营辅助、运营决策等。
6、营:可视化运营
结合可视化、标准化、自动化模型,将业务系统各项运营指标如各类日志、运行或业务数据进行数字化建模、整体业务性能展示管理,实现运营可视化,帮助快速决策分析。
四、先进技术架构
依托SOA设计理念,将IT自动化运维系统产品研发以laaS(Infrastructure as a Service)管控层、原子平台层、PaaS(Platform as a Service)层、运维场景层输出服务,提供各层资源全生命周期的运维管理,实现对企业IT资源的集中化、可视化、自动化的管理。
为弥补传统单体设计模式的缺陷,采用先进的“PaaS+微服务”的设计模式,利用分布式、高可用技术实现平台高可用、高性能。
同时,采用开放式、标准化的平台接口设计,支持基于平台进行场景式扩展开发,还提供插件式、二次开发(开源项目)的模式,可促进运维生态持续发展。