运维服务器信息收集

简介: 运维服务器信息收集; 作为一个运维,我们新服务器上架时有很多头疼的事。其中数据收集在我看来就是一个比较恶心的事。以下来讨论一下数据收集方面我的一此想法和做法,欢迎板砖^_^ 一.供货商的“特殊服务” 供 货商通常是选定不变的,而他们为了“讨好”我们会使更种手段。

运维服务器信息收集;


作为一个运维,我们新服务器上架时有很多头疼的事。其中数据收集在我看来就是一个比较恶心的事。以下来讨论一下数据收集方面我的一此想法和做法,欢迎板砖^_^
一.供货商的“特殊服务”
供 货商通常是选定不变的,而他们为了“讨好”我们会使更种手段。送钱送物也很常见(不过本人还是强烈不建议您收=.=)。不过这是我们利用他们的一个比较重 要的方法。让他们帮我们做一些事情。他们就算再头疼,为了下次合作也会帮我们完成,不管他们心里如何问候我们的祖辈。我们简化了操作,这点很重要。
(下以dell 服务器为例,我们用的80% 是dell.)
1.       提供管理卡IP对应服务器。
我 们服务器选型的时候总会考虑机器应用,这里需要提前对远程管理卡(下称rac卡)的IP进行归化。(当然就需要网络环境完善的情况下,我的意思是需要已经 对IP资源有了完整的规划)。之后,我们就把相应服务器和与之相对应的rac卡管理IP一一对应,生成一个电子文档,然后打印出来交给他们。最好将相应服 务器的标签也给他们。不管是打号机,还是口曲纸。让他们帮忙贴上。最后给他们打印出来。格式示例如下
机器编号|外网IP|内网IP|管理卡IP|磁盘配置|机器型号配置|应用|服务编码
其中 机器型号配置,磁盘配置,和管理卡IP是必须要有的
2.       贴签 + rac配置 + raid配置
让供货量出人配置rac 卡IP,配置raid ,帮你贴签。
这里需要强调一点,如果是同群集的服务器,最好不要放在一个机架上。万一某个机架出了问题你会哭的很惨。
等着他们把活干完,你去验收就行了。
3.       验收
选择一台中控机。(需要所有机器的网线已插)能过这台机器对其它机器进行管理。然后扫下22号吧。确认给他们的IP已经都打开了22端口。脚本如下(需要指定IP段)
#!/bin/bash
# Made by leary
IP=”192.168.10.50-150″
PORT=”22″
paste_line(){
nmap $IP -p $PORT -n |grep -Ev “Nmap finished|Starting Nmap”|\
while read line ;do
         if [ "$line" == "" ];then
                   printf “\n”
         else
                   printf “$-s”,”$line”
         fi
done
}
paste_line |awk ‘{print $4″ “$7}’|sed ‘s/:hBs,PORT//g’

二.MAC地址的收集
通过远程管理卡ssh 命令行管理取出。需要使用expect。用于输入密码。如果想避开ssh yes/no的问题。可以修改/etc/ssh/ssh_config 将StrictHostKeyChecking ask 改成StrictHostKeyChecking no
Expexct 脚本示例
#!/usr/bin/expect -f
spawn ssh 192.168.31.69 “racadm getsysinfo -s”
expect “*password:”
send “calvin\r”
expect eof
通过循环取出NIC1的MAC地址。(比如将结果重定向到 /tmp/leary_mac ,然后使用grep过滤)列表格式就随意了。主要为是了DHCP配置文件的添加。其它的信息也可以能过这种方法取得。只要rac卡里有。比如dell的快速服务器编码等等
统计好的信息可以通过API录入运维管理系统。总之就是日常的那个服务器记录的位置。
现在我们已经把管理系统中的主机信息完全完成了。接下的来工作就简单了。
三.Dhcp 配置文件生成。
为了快速的安装系统,通常我们都会使用网络安装。有了收集回来了mac地址,这个工作就简化了很多.网络安装不是本人重点,这里不再赘述。需要强调的是:所以的dhcp必须是基于mac地址的分发。比如
host host20 {
        hardware ethernet  xx:xx:xx:xx:xx:xx;
        fixed-address 192.168.30.20;
        filename “pxelinux.0″;
   }
四.Bios 修改启动顺序
Dell的默认启动顺序是从网络启动。这样虽然能安装系统。但安装系统如果重启,并且未关闭自动安装服务器的话,服务器会被重新安装。解决方法:仍然是通过dell rac卡的命令行模式
Expect脚本如下
#!/usr/bin/expect -f
spawn ssh 192.168.31.249
expect “*password:”
send “calvin\r”
expect “*admin1->”
send “start /system1\r”
expect “*admin1->”
send “racadm config -g cfgServerInfo -o cfgSErverFirstBootDevice \”HDD\”\r”
expect “*admin1->”
send “racadm config -g cfgServerInfo -o cfgServerBootOnce \”0\”\r”
expect “*admin1->”
send “reset /system1\r”
expect “*admin1->”
send “exit\r”
expect eof
说明:
racadm config -g cfgServerInfo -o cfgSErverFirstBootDevice “HDD” 实现从硬盘启动
racadm config -g cfgServerInfo -o cfgServerBootOnce “0″ 实现永久修改
reset /systerm1 为重启服务器
五.网络安装
不管使用什么方案。Kickstart 、FAI 等等 配置好相应的配置文件。定制的话可以通过完成安装是的自动执行脚本修改。比如配置IP等等。或者不使用pxe启动的默认配置。将其改为相应mac。方法不再此详述。
脚本示例
#!/usr/bin/expect -f
spawn ssh 192.168.31.238
expect “*password:”
send “calvin\r”
expect “*admin1->”
send “start /system1\r”
expect “*admin1->”
send “racadm config -g cfgServerInfo -o cfgSErverFirstBootDevice \”PXE\”\r”
expect “*admin1->”
send “racadm config -g cfgServerInfo -o cfgServerBootOnce \”1\”\r”
expect “*admin1->”
send “reset /system1\r”
expect “*admin1->”
send “exit\r”
expect eof
脚本说明
racadm config -g cfgServerInfo -o cfgSErverFirstBootDevice “HDD” 实现从网络启动
racadm config -g cfgServerInfo -o cfgServerBootOnce “0″ 实现临时修改
start /system1 给服务器加电
注:通过测试,rac默认是临时修改
六.Server端的流量
我测试过50台机器并发通过FAI安装debian,流量大概在120M 左右。按此值估计并发200台机器肯定是没问题的。
七.通用脚本
此脚本的主要功能要实现,通过dhcp获得的IP,或者cfg里配置指定的IP,总之就是当前的内网IP修改本地ip配置文件,并配置外网IP。部署环境也可以在此脚本中实现。如果有运维管理系统的客户端,也可以在此脚本中定义安装。但前提是要基于IP判断。
八.最后的挣扎
最后再检查一次配置的内外网IP通不通,ssh端口,iptables规则,等等相应服务。
总会有网线插错,磁盘损坏,raid配错,等情况等着你,但应该是很小的一部分了。
一次大规模的服务器上线也就是这点事了。

目录
相关文章
|
机器学习/深度学习 监控 算法
车辆违停检测:基于计算机视觉与深度学习的自动化解决方案
随着智能交通技术的发展,传统人工交通执法方式已难以满足现代城市需求,尤其是在违法停车监控与处罚方面。本文介绍了一种基于计算机视觉和深度学习的车辆违停检测系统,该系统能自动监测、识别并报警违法停车行为,大幅提高交通管理效率,降低人力成本。通过使用YOLO算法进行车辆检测,结合区域分析判断车辆是否处于禁停区,实现了从车辆识别到违停判定的全流程自动化。此系统不仅提升了交通管理的智能化水平,也为维护城市交通秩序提供了技术支持。
|
SQL 关系型数据库 MySQL
sqlite3自动插入创建时间和更新时间
在本文中,作者分享了如何在SQLite3中实现类似MySQL和Postgres的几个基本功能。首先,通过`AUTOINCREMENT`关键字设置了主键ID自增。接着,通过`DEFAULT (DATETIME('now', 'localtime'))`确保了`created_at`在数据插入时自动获取当前时间。然而,`updated_at`在数据更新时不自动更新,为解决这个问题,作者创建了一个触发器(`trigger_position_info_updated_at`),在更新数据后自动更新`updated_at`字段。
371 0
|
Linux 网络安全 数据安全/隐私保护
|
2天前
|
搜索推荐 编译器 Linux
一个可用于企业开发及通用跨平台的Makefile文件
一款适用于企业级开发的通用跨平台Makefile,支持C/C++混合编译、多目标输出(可执行文件、静态/动态库)、Release/Debug版本管理。配置简洁,仅需修改带`MF_CONFIGURE_`前缀的变量,支持脚本化配置与子Makefile管理,具备完善日志、错误提示和跨平台兼容性,附详细文档与示例,便于学习与集成。
253 116
|
17天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
11天前
|
安全 Java Android开发
深度解析 Android 崩溃捕获原理及从崩溃到归因的闭环实践
崩溃堆栈全是 a.b.c?Native 错误查不到行号?本文详解 Android 崩溃采集全链路原理,教你如何把“天书”变“说明书”。RUM SDK 已支持一键接入。
650 220
|
存储 人工智能 监控
从代码生成到自主决策:打造一个Coding驱动的“自我编程”Agent
本文介绍了一种基于LLM的“自我编程”Agent系统,通过代码驱动实现复杂逻辑。该Agent以Python为执行引擎,结合Py4j实现Java与Python交互,支持多工具调用、记忆分层与上下文工程,具备感知、认知、表达、自我评估等能力模块,目标是打造可进化的“1.5线”智能助手。
886 61