ITIL4实践之运维自研系统(上篇)

简介: 运用ITIL4实践,分析机会、风险、输入输出,探索自研运维平台。

一、前言

  • 机会
1. 构建系统化运维体系,淘汰随机的日常运维所引发的各种不确定性与资源浪费
2. 显著提升运维部在MES软件工程中的管理层级与驱动力


  • 风险
1. 前期投入大量时间进行设计论证
2. 设计方案或设计系统因满足对接等需求等缺陷,面临推倒重来的情况
3. 研发人员有效投入时间与可控产量的工时评估,每个阶段研发工时未能充分利用
4. 认知决定结果,来自领导层的持续认可与持续支持,影响到相应资源的获取与分配


  • 可用资源
1. 技术专家
2. 自建机房
3. 云资源
4. 供应商
5. 实施中心


  • 欠缺资源
1. 系统规范设计与整合经验
2. 前端研发
3. 后端研发


二、运维平台自研系统管理架构

  • 统一管理项目运维各项设施,分阶段按优先级落地实施。
1. 从基线出发,统计现有运维措施清单,包含并不限于文档、脚本、程序、人员
2. 综合评估实施的优先级,并始终保持简单易实现设计原则
3. 按优先级分配到对应实施阶段,确定具体任务得到必要的分解,投入必要时间与人员等资源促成落地
4. 分解具体系统平台实现涉及的任务与时间分配,包含并不限于概念文档、原型设计、Demo测试、开放性测试


  • 应用对象与范围约束
1. 应用对象:客户
    作为运维节点,内置到MES系统中,随交付一并实施,供日常运维操作使用。
2. 应用对象:运维部
    作为运维平台中心,全局管理客户的运维节点。


  • 项目运维生命周期中涉及的系统清单
名称 目标
备份管理系统 执行状态、文件状态
点检管理系统 执行状态
基础设施管理系统 软硬件续保状态、备件状态
演练管理系统 资源状态、定制模板镜像
代码管理系统 代码收集、版本变更
日志管理系统 增量变化状态、错误码收集
数据库管理系统 表结构状态、增量变化状态
配置中心系统 数据包、配置文件、激活服务
平台管理系统 系统工作状态、版本
前端交互系统 对接后端系统,进行内容展示当日、七日、十四日历史曲线展示
K8S管理系统 yml文件规划、资源编排、image版本管理
数据管理系统 各项系统数据收集、数据清洗、数据挖掘

三、人员编制

  • 职责关系
称谓 分工 工具
规划设计 系统架构设计、功能规划、设计方案文档输出 Excel、PPT
前端开发 UI原型设计、页面开发、交互设计、用户文档输出 Vue.js
后端开发 系统逻辑实现、框架结构、接口文档输出 Node.js、python
QA测试 功能测试、报告输出 Excel、Word
用户 第三方使用体验 浏览器

四、流程

  • 设计方案
1. 目标功能定义
2. 功能整合与裁剪
3. 设计重构
4. 验收标准与系统交付


  • 系统逻辑
1. 逻辑接口定义
2. 逻辑功能实现
3. 数据保存
4. 后端开发优化与bug修复


  • 页面设计
1. UI原型设计
2. 页面访问功能实现
3. 页面功能关联后端接口
4. 前端开发优化与bug修复


  • 功能验收
1. 接口测试
2. 功能测试
3. 故障测试
4. 汇总报告


五、功能模拟

  • 功能组件
名称 功能 特点
Ansible 批量管理、命令执行 被控端只需支持ssh,无需安装agent
Filebeat 日志收集 轻量级日志收集器,低系统消耗
ELK 日志综合 支持数据过滤,定制展示格式
Promethues 监控 数据查询 DSL 语言、指标灵活定义
Zabbix 监控 第三方模块成熟
Vue.js 用户界面 快捷开发,支持库较多,开发难度低
Node.js javascript运行环境 响应静态动态请求,管理难度低
Python 衔接各系统接口、接口测试 兼容性强、开发难度低
DB 数据存储 按需选择数据库类型,易于管理优先

后文

从元数据开始定制,轻巧易用的运维服务平台。

探索从未停止...


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
24天前
|
机器学习/深度学习 运维 监控
智能监控系统在运维中的应用与优势
传统的运维管理方式在面对日益复杂的IT系统时显得力不从心,智能监控系统的出现为运维工作带来了新的机遇。本文将探讨智能监控系统在运维中的应用与优势,介绍其工作原理以及如何有效地利用智能监控系统提升运维效率和质量。
44 2
|
1月前
|
运维 监控 安全
现代化运维管理系统的关键特征与实践指南
在当今数字化时代,现代化运维管理系统正日益成为企业提升效率、降低成本的关键工具。本文将深入探讨现代化运维管理系统的关键特征,以及实践指南,帮助企业更好地应对技术挑战,提升运维效率。
|
1月前
|
人工智能 运维 监控
现代化运维管理系统的关键性作用与挑战
随着信息技术的快速发展,现代化运维管理系统在企业中扮演着越来越重要的角色。本文将探讨现代化运维管理系统的关键作用和面临的挑战,帮助读者深入了解该领域的发展趋势。
|
1月前
|
人工智能 运维 监控
现代化运维系统的关键技术与挑战
随着信息技术的快速发展,现代化运维系统成为企业管理的重要组成部分。本文将探讨现代化运维系统中的关键技术和面临的挑战,从自动化运维、容器化技术到监控与安全性等方面展开讨论,帮助读者更好地理解和应对运维领域的挑战。
|
1月前
|
运维 Prometheus 监控
构建高效自动化运维系统的关键策略
【2月更文挑战第30天】随着云计算和微服务架构的兴起,现代IT运维环境变得愈加复杂多变。为保持业务连续性、提高响应速度并降低成本,企业亟需构建一个高效的自动化运维系统。本文将深入探讨自动化运维系统构建过程中的关键策略,包括工具和技术选型、流程优化、监控与告警体系搭建以及持续集成/持续部署(CI/CD)实践,旨在为读者提供一个清晰的构建蓝图和实用的实施建议。
|
1月前
|
运维 监控 持续交付
构建高效自动化运维体系:策略与实践
在数字化时代,企业IT基础设施的管理和维护变得日益复杂。为了提高效率、降低错误率并快速响应市场变化,构建一个高效的自动化运维体系至关重要。本文将探讨自动化运维的核心策略,并通过实际案例分析展示如何将这些策略应用于日常管理中,以实现IT运维的优化。
17 0
|
1月前
|
人工智能 运维 监控
构建高性能微服务架构:现代后端开发的挑战与策略构建高效自动化运维系统的关键策略
【2月更文挑战第30天】 随着企业应用的复杂性增加,传统的单体应用架构已经难以满足快速迭代和高可用性的需求。微服务架构作为解决方案,以其服务的细粒度、独立性和弹性而受到青睐。本文将深入探讨如何构建一个高性能的微服务系统,包括关键的设计原则、常用的技术栈选择以及性能优化的最佳实践。我们将分析微服务在处理分布式事务、数据一致性以及服务发现等方面的挑战,并提出相应的解决策略。通过实例分析和案例研究,我们的目标是为后端开发人员提供一套实用的指南,帮助他们构建出既能快速响应市场变化,又能保持高效率和稳定性的微服务系统。 【2月更文挑战第30天】随着信息技术的飞速发展,企业对于信息系统的稳定性和效率要求
|
9天前
|
运维 Kubernetes Devops
构建高效自动化运维体系:DevOps与容器技术融合实践
【4月更文挑战第15天】 在当今快速发展的信息技术时代,传统的IT运维模式已难以满足业务敏捷性的需求。本文旨在探讨如何通过整合DevOps理念和容器技术来构建一个高效的自动化运维体系。文章将详细阐述DevOps的核心原则、容器技术的基础知识,以及两者结合的优势。此外,文中还将分享一系列实践经验,包括持续集成/持续部署(CI/CD)流程的搭建、微服务架构的应用,以及监控和日志管理策略的优化,以期帮助企业实现快速、可靠且安全的软件交付过程。
|
11天前
|
人工智能 运维 监控
构建高效自动化运维体系的实践与思考
【4月更文挑战第14天】在数字化转型的浪潮中,自动化运维作为提升系统稳定性和效率的关键手段,受到了企业的广泛关注。本文将深入探讨如何构建一个高效的自动化运维体系,涵盖从基础设施的搭建到流程的优化等多个方面。通过分析当前自动化运维的挑战及解决方案,文章旨在为读者提供一套实用的策略框架,帮助企业实现运维工作的高效化、标准化和智能化。
|
16天前
|
运维 监控 Kubernetes
构建高效自动化运维体系的实践与思考
【4月更文挑战第8天】在数字化时代,IT基础设施的复杂性日益增加,传统的手工运维模式已经难以满足快速响应和高效率的需求。本文将探讨如何通过自动化工具和策略构建一个高效的自动化运维体系,旨在提高系统的稳定性、减少人为错误以及优化资源分配。文章首先分析了自动化运维的必要性,接着介绍了实现自动化的关键技术和工具,并通过案例分析展示自动化运维体系的实际效果。最后,对自动化运维的未来发展趋势进行了展望。