关于自动化运维的思考-基线

简介: DevOps几年前来看,基本都在提概念,这几年很多公司都在落地了,公司里每个自动化运维平台都不好意思。具体落实下来,做得好还是不好,水平也层次不齐。 我们不说自动化运维的意义,不讨论要不要做自动化运维。

img_0dabdcec39678c6f3aa64fa07640ec62.jpe

DevOps几年前来看,基本都在提概念,这几年很多公司都在落地了,公司里每个自动化运维平台都不好意思。具体落实下来,做得好还是不好,水平也层次不齐。

我们不说自动化运维的意义,不讨论要不要做自动化运维。做是肯定要做,然后每个人都会有一堆的问题或者想法冒出来,why,how,when,有想法是好的,最大的问题是不知道问题在那里。

从我的理解来简单说说基线,一般来说会有如下的几个问题,基本涵盖了3W

img_a68b7d5a6b523dc8e6c481e77c1b2a29.jpe

我们来逐个说一下,不对的地方欢迎拍砖,我及时纠正。

需要做一个什么样的平台

1)在这里确切的说是DB自动化平台,因为目前的主要是数据库方向的。

2)后期怎么和其他部门的平台集成

先把DB层面的工作做好,做好了,你说的话才能让人觉得靠谱。

内部先达成共识,我们要一起做,不是你做吧,我用就好了。

3)业务价值和技术价值

短期内看只有技术价值,业务价值不大,但是成为平台后,或者有一些业务对接之后,价值才能发挥出来,就好比一辆车停在那里,还要付停车费,一旦跑起来了,业务价值远大于技术价值

谁来开发维护自动化平台

1)常见的瓶颈

开发不了解DB层面的业务,DBA对于开发的技能不够熟练,这是现状也是普遍现象。

2)DBA全员开发

能者多劳,每个人都要参与,所以我最近疯狂调研,搞开发,搞前端。

分工协作,等定好了之后,一起看看怎么分工,每个人能够承担一部分的功能,都能参与进来。

3)开发能力不够怎么办

先抛开技术,看看能做什么,需要做什么 --产品规划

前期的引导和技术预研 --技术选型和规划

由小及大,模块化实现 --避免好高骛远,眼高手低

使用什么技术架构

个人理解主要分为Python栈和Java栈,还有其他的比如go等等。

1)Python栈

前端WEB

Bootstrap

后端WEB

Django

任务调度

Celery + Redis

Celery + MQ

批量操作

ansible

2)Java栈

前端WEB

后端WEB

任务调度

Jenkins

opencron

批量操作

3)数据库

MySQL

SQLlite

自定义ORM

是否需要agent

这个问题几乎无解,在有限的服务器规模怎么理解都没错。看你侧重于哪些考虑了。

有agent,数据采集和性能监控还是比较给力的。

没有agent,松耦合,部署快捷简单。

需要实现哪些功能

这个问题,如果是打算重构,重做,几乎每个人都会问,我们可以还个角度来考虑一下,自己问自己,这样也许也会有一定的收获。

1)可以反问,目前有哪些痛点

2)目前有哪些工作可以改进

3)希望今后做哪些方面的事情

可以借鉴的开源方案

目前可借鉴的方案还是蛮多的,而且国内目前开源的很多方案还是很不错的。开源项目可以参考最近火热的国内开源项目评选。

http://www.oschina.net/project/top_cn_2017?from=hometop

里面有很多非常不错的项目。

目录
相关文章
|
2月前
|
机器学习/深度学习 人工智能 运维
构建高效运维体系:从自动化到智能化的演进
本文探讨了如何通过自动化和智能化手段,提升IT运维效率与质量。首先介绍了自动化在简化操作、减少错误中的作用;然后阐述了智能化技术如AI在预测故障、优化资源中的应用;最后讨论了如何构建一个既自动化又智能的运维体系,以实现高效、稳定和安全的IT环境。
78 4
|
2月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
66 4
|
24天前
|
机器学习/深度学习 运维 监控
智能化运维:从自动化到AIOps的演进之路####
本文深入探讨了IT运维领域如何由传统手工操作逐步迈向高度自动化,并进一步向智能化运维(AIOps)转型的过程。不同于常规摘要仅概述内容要点,本摘要将直接引入一个核心观点:随着云计算、大数据及人工智能技术的飞速发展,智能化运维已成为提升企业IT系统稳定性与效率的关键驱动力。文章详细阐述了自动化工具的应用现状、面临的挑战以及AIOps如何通过预测性分析和智能决策支持,实现运维工作的质变,引领读者思考未来运维模式的发展趋势。 ####
|
24天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的崛起背景,深入分析了其核心概念、关键技术、应用场景及面临的挑战,并对比了传统IT运维模式,揭示了AIOps如何引领运维管理向更高效、智能的方向迈进。通过实际案例分析,展示了AIOps在不同行业中的应用成效,为读者提供了对未来智能运维趋势的洞察与思考。 ####
59 1
|
1月前
|
机器学习/深度学习 数据采集 人工智能
智能运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的兴起背景、核心组件及其在现代IT运维中的应用。通过对比传统运维模式,阐述了AIOps如何利用机器学习、大数据分析等技术,实现故障预测、根因分析、自动化修复等功能,从而提升系统稳定性和运维效率。文章还深入分析了实施AIOps面临的挑战与解决方案,并展望了其未来发展趋势。 ####
|
1月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
智能化运维:机器学习在故障预测和自动化响应中的应用
60 4
|
2月前
|
运维 jenkins 持续交付
自动化部署的魅力:如何用Jenkins和Docker简化运维工作
【10月更文挑战第7天】在现代软件开发周期中,快速且高效的部署是至关重要的。本文将引导你理解如何使用Jenkins和Docker实现自动化部署,从而简化运维流程。我们将从基础概念开始,逐步深入到实战操作,让你轻松掌握这一强大的工具组合。通过这篇文章,你将学会如何利用这些工具来提升你的工作效率,并减少人为错误的可能性。
|
2月前
|
运维 Prometheus 监控
运维中的自动化实践每月一次的系统维护曾经是许多企业的噩梦。不仅因为停机时间长,更因为手动操作容易出错。然而,随着自动化工具的引入,这一切正在悄然改变。本文将探讨自动化在IT运维中的重要性及其具体应用。
在当今信息技术飞速发展的时代,企业对系统的稳定性和效率要求越来越高。传统的手动运维方式已经无法满足现代企业的需求。自动化技术的引入不仅提高了运维效率,还显著降低了出错风险。本文通过几个实际案例,展示了自动化在IT运维中的具体应用,包括自动化部署、监控告警和故障排除等方面,旨在为读者提供一些实用的参考。
|
2月前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
【10月更文挑战第1天】智能化运维:机器学习在故障预测和自动化响应中的应用
75 3
|
2月前
|
机器学习/深度学习 运维 监控
构建高效运维体系:从自动化到智能化的演进之路
在当今数字化时代,运维工作的重要性日益凸显。随着企业业务的不断扩展和技术的日新月异,传统的运维方式已难以满足现代企业的需求。因此,构建一个高效、智能的运维体系成为了企业发展的关键。本文将探讨如何从自动化逐步演进到智能化,以实现运维工作的高效化和智能化。