ansible 自动化运维监控方案

简介: 本文介绍如何利用ansible实时或自动采集受控主机的信息

1. 引言

1.1 编写目的

减少日益增加的服务器运维工作,高效管理,集群监控物理机与虚拟机状态,统一管理

1.2 背景

a. 定期对服务器资源使用情况进行汇总,生成报表

b. 推动自动化运维建设,经过对比,选择 ansible 进行测试使用

1.3 参考材料

a. ansible 介绍文档

b. Centos 官网

2. 介绍

2.1 ansible 介绍

ansible 是新出现的自动化运维工具,基于 Python 开发,集合了众多运维工具(puppet、cfengine、chef、func、fabric)的优点,

实现了批量系统配置、批量程序部署、批量运行命令等功能。Ansible架构相对比较简单,仅需通过 SSH 连接客户机执行任务即可

图片.png

2.2 组件介绍

微信图片_20240123145530.png

3. 测试环境与过程

3.1 测试环境

a. 主机清单

微信图片_20240123145735.png

b. 远程用户 alice(需配置 sudo 权限)

c. Ansible 版本 ansible 2.9.27,python version = 2.7.5


3.2 测试步骤

a. Control 主机安装 ansible

微信图片_20240123145914.png

b. 为 alice 用户配置 sudo 权限

微信图片_20240123150012.png

c. 配置 ssh 免密登录

ssh-keygen

#生成私钥公钥

ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.0.111

d. 添加 control 主机域名解析

微信图片_20240123150157.png

e. 编写 ansible 主配置文件 ansible.cfg

[defaults]

inventory

= /etc/ansible/hosts #清单文件

roles_path

= /etc/ansible/roles #角色目录

remote_user = root #远程用户ansible 自动化运维监控方案

[privilege_escalation]

become=True #是否提权

become_method=sudo #提权方式

become_user=root #提权用户

become_ask_pass=False #是否需要密码

f. 编辑 hosts 清单

Vim ~/ansible/hosts

[node1]

node1

[node2]

node2

g. 测试是否远程成功

微信图片_20240123150525.png

h. 编写受控主机硬件使用情况自动统计剧本

[alice@control ansible]$ vim hardware.yml

微信图片_20240123150625.png

I. 最终呈现结果

微信图片_20240123150704.png

相关文章
|
2天前
|
数据采集 存储 监控
Python爬虫自动化:定时监控快手热门话题
Python爬虫自动化:定时监控快手热门话题
|
8天前
|
运维 监控 安全
从实践到自动化:现代运维管理的转型与挑战
本文探讨了现代运维管理从传统人工模式向自动化转型的必要性与路径,分析了传统运维的痛点,如效率低、响应慢、依赖经验等问题,并介绍了自动化运维在提升效率、降低成本、增强系统稳定性与安全性方面的优势。结合技术工具与实践案例,文章展示了企业如何通过自动化实现运维升级,推动数字化转型,提升业务竞争力。
|
2月前
|
监控 安全 Linux
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
70 2
Arista CloudVision 2025.1 - 多云和数据中心网络自动化、监控和分析
|
3月前
|
消息中间件 运维 监控
智能运维,由你定义:SAE自定义日志与监控解决方案
通过引入 Sidecar 容器的技术,SAE 为用户提供了更强大的自定义日志与监控解决方案,帮助用户轻松实现日志采集、监控指标收集等功能。未来,SAE 将会支持 istio 多租场景,帮助用户更高效地部署和管理服务网格。
337 52
|
2月前
|
运维 监控 中间件
Linux运维笔记 - 如何使用WGCLOUD监控交换机的流量
WGCLOUD是一款开源免费的通用主机监控工具,安装使用都非常简单,它可以监控主机、服务器的cpu、内存、磁盘、流量等数据,也可以监控数据库、中间件、网络设备
|
3月前
|
人工智能 运维 监控
阿里云携手神州灵云打造云内网络性能监测标杆 斩获中国信通院高质量数字化转型十大案例——金保信“云内网络可观测”方案树立云原生运维新范式
2025年,金保信社保卡有限公司联合阿里云与神州灵云申报的《云内网络性能可观测解决方案》入选高质量数字化转型典型案例。该方案基于阿里云飞天企业版,融合云原生引流技术和流量“染色”专利,解决云内运维难题,实现主动预警和精准观测,将故障排查时间从数小时缩短至15分钟,助力企业降本增效,形成可跨行业复制的数字化转型方法论。
150 6
|
4月前
|
数据采集 运维 监控
数据采集监控与告警:错误重试、日志分析与自动化运维
本文探讨了数据采集技术从“简单采集”到自动化运维的演进。传统方式因反爬策略和网络波动常导致数据丢失,而引入错误重试、日志分析与自动化告警机制可显著提升系统稳定性与时效性。正方强调健全监控体系的重要性,反方则担忧复杂化带来的成本与安全风险。未来,结合AI与大数据技术,数据采集将向智能化、全自动方向发展,实现动态调整与智能识别反爬策略,降低人工干预需求。附带的Python示例展示了如何通过代理IP、重试策略及日志记录实现高效的数据采集程序。
202 7
数据采集监控与告警:错误重试、日志分析与自动化运维
|
4月前
|
机器学习/深度学习 人工智能 运维
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
机器学习+自动化运维:让服务器自己修Bug,运维变轻松!
193 14
|
4月前
|
消息中间件 运维 监控
智能运维,由你定义:SAE自定义日志与监控解决方案
SAE(Serverless应用引擎)是阿里云推出的全托管PaaS平台,致力于简化微服务应用开发与管理。为满足用户对可观测性和运维能力的更高需求,SAE引入Sidecar容器技术,实现日志采集、监控指标收集等功能扩展,且无需修改主应用代码。通过共享资源模式和独立资源模式,SAE平衡了资源灵活性与隔离性。同时,提供全链路运维能力,确保应用稳定性。未来,SAE将持续优化,支持更多场景,助力用户高效用云。
|
5月前
|
监控 jenkins 测试技术
Ansible与Jenkins:自动化工具的对比
Ansible和Jenkins是自动化领域的两大巨头。Ansible专注于配置管理和任务自动化,采用无代理架构,使用YAML定义配置,具有幂等性和可扩展性。Jenkins则擅长持续集成和持续交付(CI/CD),支持丰富的插件生态系统,适用于自动化构建、测试和部署。两者各有优势,Ansible适合配置管理与大规模部署,Jenkins则在CI/CD方面表现出色。结合使用可创建更强大的自动化工作流,提升团队生产力和软件质量。选择工具时应根据具体需求决定。