ansible 自动化运维监控方案

简介: 本文介绍如何利用ansible实时或自动采集受控主机的信息

1. 引言

1.1 编写目的

减少日益增加的服务器运维工作,高效管理,集群监控物理机与虚拟机状态,统一管理

1.2 背景

a. 定期对服务器资源使用情况进行汇总,生成报表

b. 推动自动化运维建设,经过对比,选择 ansible 进行测试使用

1.3 参考材料

a. ansible 介绍文档

b. Centos 官网

2. 介绍

2.1 ansible 介绍

ansible 是新出现的自动化运维工具,基于 Python 开发,集合了众多运维工具(puppet、cfengine、chef、func、fabric)的优点,

实现了批量系统配置、批量程序部署、批量运行命令等功能。Ansible架构相对比较简单,仅需通过 SSH 连接客户机执行任务即可

图片.png

2.2 组件介绍

微信图片_20240123145530.png

3. 测试环境与过程

3.1 测试环境

a. 主机清单

微信图片_20240123145735.png

b. 远程用户 alice(需配置 sudo 权限)

c. Ansible 版本 ansible 2.9.27,python version = 2.7.5


3.2 测试步骤

a. Control 主机安装 ansible

微信图片_20240123145914.png

b. 为 alice 用户配置 sudo 权限

微信图片_20240123150012.png

c. 配置 ssh 免密登录

ssh-keygen

#生成私钥公钥

ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.0.111

d. 添加 control 主机域名解析

微信图片_20240123150157.png

e. 编写 ansible 主配置文件 ansible.cfg

[defaults]

inventory

= /etc/ansible/hosts #清单文件

roles_path

= /etc/ansible/roles #角色目录

remote_user = root #远程用户ansible 自动化运维监控方案

[privilege_escalation]

become=True #是否提权

become_method=sudo #提权方式

become_user=root #提权用户

become_ask_pass=False #是否需要密码

f. 编辑 hosts 清单

Vim ~/ansible/hosts

[node1]

node1

[node2]

node2

g. 测试是否远程成功

微信图片_20240123150525.png

h. 编写受控主机硬件使用情况自动统计剧本

[alice@control ansible]$ vim hardware.yml

微信图片_20240123150625.png

I. 最终呈现结果

微信图片_20240123150704.png

相关文章
|
8月前
|
数据采集 运维 监控
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
本文系统解析爬虫与自动化核心技术,涵盖HTTP请求、数据解析、分布式架构及反爬策略,结合Scrapy、Selenium等框架实战,助力构建高效、稳定、合规的数据采集系统。
1241 62
爬虫与自动化技术深度解析:从数据采集到智能运维的完整实战指南
|
人工智能 自然语言处理 算法
AI智能混剪视频大模型开发方案:从文字到视频的自动化生成·优雅草卓伊凡
AI智能混剪视频大模型开发方案:从文字到视频的自动化生成·优雅草卓伊凡
1607 0
AI智能混剪视频大模型开发方案:从文字到视频的自动化生成·优雅草卓伊凡
|
9月前
|
运维 Linux 网络安全
自动化真能省钱?聊聊运维自动化如何帮企业优化IT成本
自动化真能省钱?聊聊运维自动化如何帮企业优化IT成本
279 4
|
监控 安全 Linux
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
514 2
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
|
12月前
|
机器学习/深度学习 Kubernetes 监控
Kubernetes 节点故障自愈方案:结合 Node Problem Detector 与自动化脚本
本文深入探讨了Kubernetes节点故障自愈方案,结合Node Problem Detector(NPD)与自动化脚本,提供技术细节、完整代码示例及实战验证。文章分析了硬件、系统和内核层面的典型故障场景,指出现有监控体系的局限性,并提出基于NPD的实时事件捕获与自动化诊断树的改进方案。通过深度集成NPD、设计自动化修复引擎以及展示内核死锁恢复的实战案例,文章详细说明了自愈流程的实现步骤与性能优势。此外,还提供了生产环境部署指南、高可用架构设计及安全防护措施,并展望了机器学习增强故障预测和混沌工程验证的进阶优化方向。全文约1.2万字,适合希望提升Kubernetes集群稳定性的技术人员阅读。
770 2
|
11月前
|
数据采集 存储 监控
Python爬虫自动化:定时监控快手热门话题
Python爬虫自动化:定时监控快手热门话题
|
11月前
|
运维 监控 安全
从实践到自动化:现代运维管理的转型与挑战
本文探讨了现代运维管理从传统人工模式向自动化转型的必要性与路径,分析了传统运维的痛点,如效率低、响应慢、依赖经验等问题,并介绍了自动化运维在提升效率、降低成本、增强系统稳定性与安全性方面的优势。结合技术工具与实践案例,文章展示了企业如何通过自动化实现运维升级,推动数字化转型,提升业务竞争力。
|
数据采集 运维 监控
数据采集监控与告警:错误重试、日志分析与自动化运维
本文探讨了数据采集技术从“简单采集”到自动化运维的演进。传统方式因反爬策略和网络波动常导致数据丢失,而引入错误重试、日志分析与自动化告警机制可显著提升系统稳定性与时效性。正方强调健全监控体系的重要性,反方则担忧复杂化带来的成本与安全风险。未来,结合AI与大数据技术,数据采集将向智能化、全自动方向发展,实现动态调整与智能识别反爬策略,降低人工干预需求。附带的Python示例展示了如何通过代理IP、重试策略及日志记录实现高效的数据采集程序。
638 7
数据采集监控与告警:错误重试、日志分析与自动化运维
|
机器学习/深度学习 人工智能 运维
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
584 14

热门文章

最新文章