运维资产管理系统cmdb对实施自动化运维的重要性

简介:

前言:

在新公司负责全网的自动化运维平台及给各个业务线提供接口数据。这工作和以前做的很类似,也算是比较顺手的工作,这段时候遇见一些问题,导致开发的前进速度的放慢了,具体有哪些的不完善,我这里就先不摆出了,但是会把我遇到的问题的根源,放大炮似的描述下。

       先不吐槽,先表扬下新公司的资产系统还算可以的,比不少公司的资产管理也都要强大,只是我人比较刺,事多,缘由是我见过比这更强大的,不仅看过,用过,而且在那开发部门里呆过,也参与过这项目相关的资产的开发。 经常搞这些个东西,所以整个开发实现和流程步骤也都算明白。

扯远点,既然大家都在学习python,完全可以用python django这类的模式,开发资产信息管理系统



好了,开始说正题:


什么是资产系统,时尚的英文名字叫做,cmdb,同义为配置管理数据系统。


有些人知道,资产系统和cmdb并不是一回事,可以说cmdb包含了资产系统。


下面看看有些产品网站给与资产系统和cmdb的定义:

wKiom1MTNlXBlnAlAAIoT628C2A180.jpg


他俩看似不一样,但是又一样,但是可以确定的是,他们之间有很大的关联。,我们也不要太主观的区分他俩,爱咋地咋地,做东西就要往高端了说,咱们要做的就是cmdb  , 欧了 !


开始介绍下,我的资产管理cmdb的一些相关经验和注意的东西


为什么要重视他?  


最简单的可以知道买的服务器上没有上线,谁在用,哪个业务在用,用的是哪个ip,放到了哪里,有没有保修过,使用情况如何 ? ip的现状,占用情况。


说的全面点:

IP:所有IP、IPMI,所有MAC

配置:采购配置、实际配置、OS

应用分类信息:多级分类组合、应用组合

资产号、序列号、型号、负责人、合同、上架日期

IDC、机柜、网络

其他分类:虚/实、线上/线下/库备/报废、自有/外部


需要跨系统数据组合的运维报表

全国将过保、将报废、备机的IDC分布、项目分布

虚拟化资源利用率、节约率、故障率、成本分摊

强大的报表生成能力


高级点,可以用从库里面,直接展现图表,知道哪个业务线的部署节点的情况,通过这些节点直接去zabbix接口趣监控的load数据。得到类似该业务线的全网的load图。


再高级点,存放了系统的密码以及管理网的密码,以及机房展现图。


这些为什么要重视他的原因,也正是我期待的资产系统的一部分功能。


到这里可能有些朋友还没咋看懂我在说啥,是我写的有点乱了,哈


提下我和同事在工作中遇见的问题吧,这样大家能好理解点 。


原文:http://rfyiamcool.blog.51cto.com/1030776/1370928


我们对面的组是系统组,经常让被他们的电话声音吵了思路,有不少的原因是和ibm、dell的工作人员核实服务器的位置,大家的记录虽然也是数据库里面查询查来的,总是觉得不够直观。  如果实现了机房的拓扑图那就爽了。 可以很直观的看到查询机房的各个情况。


wKioL1MbaJTyfDznAAodUobwmCw763.jpg



在平台上输入lvs后端的节点,但是你是用张三登录的,这个时候,添加后端ip域名之前我需要做些相关的认证。  首先检测这个ip是不是公司的已有ip地址,这个ip地址是不是你当前用户名资产下的。 没有的return false; 别让他继续了。


wKiom1MTOpCD2hMYAAB_Yxel4VY894.jpg


他想拿出几台服务器做集群,在自助平台上操作,根绝资产那边的硬件情况做个分类,做集群算法的时候,后端会自己跑到资产接口拿数据,根据情况给出不同的 weight权衡值。


       新上线的服务器,做为后端的web节点,部署puppet或者saltstack环境的时候,我们需要他的密码。  这个时候,需要从资产系统里面拿信息,然后初始化环境,比如用saltstack的jinja2 模板数据,配置的外网ip地址,ip route,主机名,kerberos权限表。  都是需要在一个接口拿,对头,只能是资产系统啦。

原文:http://rfyiamcool.blog.51cto.com/1030776/1370928

      在平台上针对lvs有重大配置更改的时候,需要给领导发一个邮件或者是手机,用来确定,确定之后才能继续下去。 你的领导的联系方式怎么搞到,肯定也是资产系统里面的,不然在你的mysql再次录入,显得太二了。


      上线说的是我作为运维开发所需要的接口数据,这些是从cmdb里面搞到的,说起来容易,cmdb的数据作准真的好难搞,前公司也是花费了大量的心力和实习生们的努力才把数据作准,就算是现在也不敢说数据是100%准的。


数据是如何填满的?

A.    很简单,就是遍历要查的数据,服务器的直接跑收集的工具,还有些东西可以用ipmi去跑收集。

同事用gearman和厂家工具写的分布式框架,是专门抓取数据的,有时间让他开源。我最开始写过批量获取服务器硬件数据的脚本,用zeromq做的任务分发队列效率很高的,刚找了半天,貌似当时没有推到github里 。。。 晕头。。。 我再找找 !


B.   一些机柜机房的资产信息,可以给世纪互联一个添加数据的页面,等他们写好,你过去核对下,合格后,直接点击入库。


做好资产管理系统,我觉得在开发上没啥难度,在公司里随便拉个php开发,也都能搞定,推行的难度还是在于后期的数据维护。


1.  制定规范流程

2.  挥动所有能指派的力量去核对数据

3.  用流程去增删改查数据



好了,先这么着吧,今天说的很乱。。。算是个吐槽吧 !



 本文转自 rfyiamcool 51CTO博客,原文链接:http://blog.51cto.com/rfyiamcool/1370928,如需转载请自行联系原作者


相关文章
|
2月前
|
运维 Linux Apache
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
Puppet 作为一款强大的自动化运维工具,被广泛应用于配置管理领域。通过定义资源的状态和关系,Puppet 能够确保系统始终处于期望的配置状态。
73 3
|
21天前
|
人工智能 自然语言处理 JavaScript
Agent-E:基于 AutoGen 代理框架构建的 AI 浏览器自动化系统
Agent-E 是一个基于 AutoGen 代理框架构建的智能自动化系统,专注于浏览器内的自动化操作。它能够执行多种复杂任务,如填写表单、搜索和排序电商产品、定位网页内容等,从而提高在线效率,减少重复劳动。本文将详细介绍 Agent-E 的功能、技术原理以及如何运行该系统。
73 5
Agent-E:基于 AutoGen 代理框架构建的 AI 浏览器自动化系统
|
21天前
|
监控 测试技术 定位技术
探索软件测试中的自动化测试框架选择与实施###
本文不概述传统意义上的摘要内容,而是直接以一段对话形式引入,旨在激发读者兴趣。想象一下,你是一名勇敢的探险家,面前摆满了各式各样的自动化测试工具地图,每张地图都指向未知的宝藏——高效、精准的软件测试领域。我们将一起踏上这段旅程,探讨如何根据项目特性选择合适的自动化测试框架,并分享实施过程中的关键步骤与避坑指南。 ###
31 4
|
29天前
|
监控 安全 测试技术
在实施自动化和持续集成的过程中,如何确保代码的安全性和合规性
在自动化和持续集成中,确保代码安全与合规至关重要。措施包括集成自动化安全工具、执行自动化合规检查、进行代码质量与安全检测、评估开源代码安全、实施基础设施即代码的安全标准、采用多层防御策略、加强安全教育与文化建设、使用合规性检测工具及许可证合规分析等,共同提升代码安全性与合规水平。
|
25天前
|
机器学习/深度学习 运维 监控
智能化运维:从自动化到AIOps的演进之路####
本文深入探讨了IT运维领域如何由传统手工操作逐步迈向高度自动化,并进一步向智能化运维(AIOps)转型的过程。不同于常规摘要仅概述内容要点,本摘要将直接引入一个核心观点:随着云计算、大数据及人工智能技术的飞速发展,智能化运维已成为提升企业IT系统稳定性与效率的关键驱动力。文章详细阐述了自动化工具的应用现状、面临的挑战以及AIOps如何通过预测性分析和智能决策支持,实现运维工作的质变,引领读者思考未来运维模式的发展趋势。 ####
|
25天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的崛起背景,深入分析了其核心概念、关键技术、应用场景及面临的挑战,并对比了传统IT运维模式,揭示了AIOps如何引领运维管理向更高效、智能的方向迈进。通过实际案例分析,展示了AIOps在不同行业中的应用成效,为读者提供了对未来智能运维趋势的洞察与思考。 ####
61 1
|
1月前
|
监控 安全 测试技术
在实施自动化和持续集成的过程中,如何确保代码的安全性和合规性?
在实施自动化和持续集成的过程中,如何确保代码的安全性和合规性?
|
1月前
|
机器学习/深度学习 数据采集 人工智能
智能运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的兴起背景、核心组件及其在现代IT运维中的应用。通过对比传统运维模式,阐述了AIOps如何利用机器学习、大数据分析等技术,实现故障预测、根因分析、自动化修复等功能,从而提升系统稳定性和运维效率。文章还深入分析了实施AIOps面临的挑战与解决方案,并展望了其未来发展趋势。 ####
|
1月前
|
缓存 运维 监控
【运维必备知识】Linux系统平均负载与top、uptime命令详解
系统平均负载是衡量Linux服务器性能的关键指标之一。通过使用 `top`和 `uptime`命令,可以实时监控系统的负载情况,帮助运维人员及时发现并解决潜在问题。理解这些工具的输出和意义是确保系统稳定运行的基础。希望本文对Linux系统平均负载及相关命令的详细解析能帮助您更好地进行系统运维和性能优化。
53 3
|
1月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
智能化运维:机器学习在故障预测和自动化响应中的应用
61 4