运维前线:一线运维专家的运维方法、技巧与实践1.1 概述

简介:

第1章

自动化运维之深度解码

作者简介

王津银,2005年硕士毕业,参与电信BOSS系统研发两年。而后于2007年进入腾讯公司接触运维,经历服务器从百到万的运维历程,先后在YY和UC参与不同业务形态的运维,期间带过前端运维、数据存储运维、YY语音、游戏运维、运维研发等多种运维团队,对运维有着全面的理解。极力倡导互联网价值的运维理念,即面向用户的价值是由自动化平台来交付和传递,同时由数据化来提炼和衡量的。“精益运维”理论的创始人。个人微信公众号“互联网运维杂谈”(waynewang_ops),粉丝2.5万人,现创办优维科技公司,旨在缩短企业到达互联网运维的路径。

自动化运维是一个人让人兴奋且容易失控的话题!兴奋是因为我想做一次尝试,把它的全貌和细节说清楚;容易失控是因为涉及点太多,一则怕遗漏,二则怕顾此失彼。带着这份复杂的心情,我们来一次自动化运维的解析之旅吧。说实话,一个运维团队的运维能力究竟如何,其实看一个自动化管理系统便可得知!


1.1 概述


作为开篇,首先让我们来熟悉一下运维全平台的规划体系吧,如图1-1所示。

很多人看到这样一个架构图,可能会纳闷,难道对于一个小型企业来说,也要实施如此复杂的运维自动化体系吗?其实,对于不同规模的企业来说,对运维自动化的诉求的确是不同的。对于大规模企业,如BAT,这些能力基本上都是必不可少的;而对于小型互联网企业,比如

 

图1-1 运维全平台规划体系

说App开发公司,则核心的自动化诉求可能更多的是配置管理工具,比如说Puppet、SaltStack或Jenkins+Rsync等。

我们不禁要问,有什么样的准则可以让我们作为依据来判断何时该如何导入自动化?应该导入自动化的哪些部分?当你需要持续、频繁地进行一些事情时,此时就需要引入自动化,比如说版本发布,如果这个时候你感觉到很痛苦,那么此时就需要引入自动化了。关于应该导入自动化的哪些部分,我个人的经验是根据角色去梳理他的工作现状(持续、频繁的工作),然后引入自动化的能力,再根据角色人数的多与少来确定事情的优先级,比如说系统管理和业务发布,很明显业务发布的优先级更高,因为它的自动化所带来的人力解放的收益更大。当然还有一种更理想的情况,那就是根据整体业务交付流来构建,以它的全流程自动化为目标,此时引入的是该交付链上所有的自动化能力,当然对于很多企业来说,这种自动化实现的代价很高,而得到的收益却很小。

相关文章
|
1月前
|
人工智能 运维 负载均衡
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
206 23
|
1月前
|
Kubernetes Java 持续交付
小团队 CI/CD 实践:无需运维,Java Web应用的自动化部署
本文介绍如何使用GitHub Actions和阿里云Kubernetes(ACK)实现Java Web应用的自动化部署。通过CI/CD流程,开发人员无需手动处理复杂的运维任务,从而提高效率并减少错误。文中详细讲解了Docker与Kubernetes的概念,并演示了从创建Kubernetes集群、配置容器镜像服务到设置GitHub仓库Secrets及编写GitHub Actions工作流的具体步骤。最终实现了代码提交后自动构建、推送镜像并部署到Kubernetes集群的功能。整个过程不仅简化了部署流程,还确保了应用在不同环境中的稳定运行。
75 9
|
1月前
|
存储 弹性计算 运维
云端问道 7 期实践教学-使用操作系统智能助手 OS Copilot 轻松运维与编程
使用操作系统智能助手 OS Copilot 轻松运维与编程
62 14
|
2月前
|
运维 监控 Cloud Native
云原生之运维监控实践:使用 taosKeeper 与 TDinsight 实现对 时序数据库TDengine 服务的监测告警
在数字化转型的过程中,监控与告警功能的优化对保障系统的稳定运行至关重要。本篇文章是“2024,我想和 TDengine 谈谈”征文活动的三等奖作品之一,详细介绍了如何利用 TDengine、taosKeeper 和 TDinsight 实现对 TDengine 服务的状态监控与告警功能。作者通过容器化安装 TDengine 和 Grafana,演示了如何配置 Grafana 数据源、导入 TDinsight 仪表板、以及如何设置告警规则和通知策略。欢迎大家阅读。
68 0
|
2月前
|
运维 监控 持续交付
自动化运维在现代数据中心的应用与实践####
本文探讨了自动化运维技术在现代数据中心中的应用现状与实践案例,分析了其如何提升运维效率、降低成本并增强系统稳定性。通过具体实例,展示了自动化工具如Ansible、Puppet及Docker在环境配置、软件部署、故障恢复等方面的实际应用效果,为读者提供了一套可参考的实施框架。 ####
|
26天前
|
Linux 持续交付 调度
HTTPS 证书自动化运维:https证书管理系统-自动化部署
本指南介绍如何部署Linux服务器节点。首先复制生成的Linux脚本命令,然后将其粘贴到目标服务器上运行。接着刷新页面查看节点记录,并点击“配置证书”选择证书以自动部署。最后,节点部署完成,后续将自动调度,无需人工干预。
HTTPS 证书自动化运维:https证书管理系统-自动化部署
|
26天前
|
监控 运维
HTTPS 证书自动化运维:https证书管理系统- 自动化监控
本文介绍如何设置和查看域名或证书监控。步骤1:根据证书状态选择新增域名或证书监控,线上部署推荐域名监控,未部署选择证书监控。步骤2:查询监控记录详情。步骤3:在详情页查看每日定时检测结果或手动测试。
HTTPS 证书自动化运维:https证书管理系统- 自动化监控
|
26天前
|
运维
HTTPS 证书自动化运维:https证书管理系统之自动化签发
通过访问【https://www.lingyanspace.com】注册账户,进入证书服务菜单并新增证书。填写域名(单域名、多域名或泛域名),创建订单后添加云解析DNS记录进行质检。确认完成后可下载证书,并支持后续查看、更新和定时更新功能。证书过期前15天自动更新,需配置邮箱接收通知。
HTTPS 证书自动化运维:https证书管理系统之自动化签发
|
1月前
|
人工智能 运维 监控
AI辅助的运维流程自动化:实现智能化管理的新篇章
AI辅助的运维流程自动化:实现智能化管理的新篇章
522 22
|
3月前
|
机器学习/深度学习 运维 监控
智能化运维:从自动化到AIOps的演进之路####
本文深入探讨了IT运维领域如何由传统手工操作逐步迈向高度自动化,并进一步向智能化运维(AIOps)转型的过程。不同于常规摘要仅概述内容要点,本摘要将直接引入一个核心观点:随着云计算、大数据及人工智能技术的飞速发展,智能化运维已成为提升企业IT系统稳定性与效率的关键驱动力。文章详细阐述了自动化工具的应用现状、面临的挑战以及AIOps如何通过预测性分析和智能决策支持,实现运维工作的质变,引领读者思考未来运维模式的发展趋势。 ####