RHCE 系列(四): 使用 Shell 脚本自动化 Linux 系统维护任务

简介: 之前我听说高效的系统管理员的一个特点是懒惰。一开始看起来很矛盾,但作者接下来解释了其中的原因: RHCE 系列:第四部分 - 自动化 Linux 系统维护任务 如果一个系统管理员花费大量的时间解决问题以及做重复的工作,你就应该怀疑他这么做是否正确。

之前我听说高效的系统管理员的一个特点是懒惰。一开始看起来很矛盾,但作者接下来解释了其中的原因:

RHCE 系列:第四部分 - 自动化 Linux 系统维护任务

RHCE 系列:第四部分 - 自动化 Linux 系统维护任务

如果一个系统管理员花费大量的时间解决问题以及做重复的工作,你就应该怀疑他这么做是否正确。换句话说,一个高效的系统管理员/工程师应该制定一个计划使得其尽量花费少的时间去做重复的工作,以及通过使用本系列中第三部分 使用 Linux 工具集监视系统活动报告 介绍的工具来预见问题。因此,尽管看起来他/她没有做很多的工作,但那是因为 shell 脚本帮助完成了他的/她的大部分任务,这也就是本章我们将要探讨的东西。

什么是 shell 脚本?

简单的说,shell 脚本就是一个由 shell 一步一步执行的程序,而 shell 是在 Linux 内核和最终用户之间提供接口的另一个程序。

默认情况下,RHEL 7 中用户使用的 shell 是 bash(/bin/bash)。如果你想知道详细的信息和历史背景,你可以查看这个维基页面

关于这个 shell 提供的众多功能的介绍,可以查看 man 手册,也可以从 (Bash 命令)处下载 PDF 格式。除此之外,假设你已经熟悉 Linux 命令(否则我强烈建议你首先看一下 Tecmint.com 中的文章 从新手到系统管理员指南 )。现在让我们开始吧。

写一个脚本显示系统信息

为了方便,首先让我们新建一个目录用于保存我们的 shell 脚本:

 
  1. # mkdir scripts
  2. # cd scripts

然后用喜欢的文本编辑器打开新的文本文件 system_info.sh。我们首先在头部插入一些注释以及一些命令:

 
  1. #!/bin/bash
  2. # RHCE 系列第四部分示例脚本
  3. # 该脚本会返回以下这些系统信息:
  4. # -主机名称:
  5. echo -e "\e[31;43m***** HOSTNAME INFORMATION *****\e[0m"
  6. hostnamectl
  7. echo ""
  8. # -文件系统磁盘空间使用:
  9. echo -e "\e[31;43m***** FILE SYSTEM DISK SPACE USAGE *****\e[0m"
  10. df -h
  11. echo ""
  12. # -系统空闲和使用中的内存:
  13. echo -e "\e[31;43m ***** FREE AND USED MEMORY *****\e[0m"
  14. free
  15. echo ""
  16. # -系统启动时间:
  17. echo -e "\e[31;43m***** SYSTEM UPTIME AND LOAD *****\e[0m"
  18. uptime
  19. echo ""
  20. # -登录的用户:
  21. echo -e "\e[31;43m***** CURRENTLY LOGGED-IN USERS *****\e[0m"
  22. who
  23. echo ""
  24. # -使用内存最多的 5 个进程
  25. echo -e "\e[31;43m***** TOP 5 MEMORY-CONSUMING PROCESSES *****\e[0m"
  26. ps -eo %mem,%cpu,comm --sort=-%mem | head -n 6
  27. echo ""
  28. echo -e "\e[1;32mDone.\e[0m"

然后,给脚本可执行权限:

 
  1. # chmod +x system_info.sh

运行脚本:

 
  1. ./system_info.sh

注意为了更好的可视化效果各部分标题都用颜色显示:

服务器监视 Shell 脚本

服务器监视 Shell 脚本

颜色功能是由以下命令提供的:

 
  1. echo -e "\e[COLOR1;COLOR2m<YOUR TEXT HERE>\e[0m"

其中 COLOR1 和 COLOR2 是前景色和背景色(Arch Linux Wiki 有更多的信息和选项解释), 是你想用颜色显示的字符串。

使任务自动化

你想使其自动化的任务可能因情况而不同。因此,我们不可能在一篇文章中覆盖所有可能的场景,但是我们会介绍使用 shell 脚本可以使其自动化的三种典型任务:

1) 更新本地文件数据库, 2) 查找(或者删除)有 777 权限的文件, 以及 3) 文件系统使用超过定义的阀值时发出警告。

让我们在脚本目录中新建一个名为 auto_tasks.sh 的文件并添加以下内容:

 
  1. #!/bin/bash
  2. # 自动化任务示例脚本:
  3. # -更新本地文件数据库:
  4. echo -e "\e[4;32mUPDATING LOCAL FILE DATABASE\e[0m"
  5. updatedb
  6. if [ $? == 0 ]; then
  7. echo "The local file database was updated correctly."
  8. else
  9. echo "The local file database was not updated correctly."
  10. fi
  11. echo ""
  12. # -查找 和/或 删除有 777 权限的文件。
  13. echo -e "\e[4;32mLOOKING FOR FILES WITH 777 PERMISSIONS\e[0m"
  14. # Enable either option (comment out the other line), but not both.
  15. # Option 1: Delete files without prompting for confirmation. Assumes GNU version of find.
  16. #find -type f -perm 0777 -delete
  17. # Option 2: Ask for confirmation before deleting files. More portable across systems.
  18. find -type f -perm 0777 -exec rm -i {} +;
  19. echo ""
  20. # -文件系统使用率超过定义的阀值时发出警告
  21. echo -e "\e[4;32mCHECKING FILE SYSTEM USAGE\e[0m"
  22. THRESHOLD=30
  23. while read line; do
  24. # This variable stores the file system path as a string
  25. FILESYSTEM=$(echo $line | awk '{print $1}')
  26. # This variable stores the use percentage (XX%)
  27. PERCENTAGE=$(echo $line | awk '{print $5}')
  28. # Use percentage without the % sign.
  29. USAGE=${PERCENTAGE%?}
  30. if [ $USAGE -gt $THRESHOLD ]; then
  31. echo "The remaining available space in $FILESYSTEM is critically low. Used: $PERCENTAGE"
  32. fi
  33. done < <(df -h --total | grep -vi filesystem)

请注意该脚本最后一行两个 < 符号之间有个空格。

查找 777 权限文件的 Shell 脚本

查找 777 权限文件的 Shell 脚本

使用 Cron

想更进一步提高效率,你不会想只是坐在你的电脑前手动执行这些脚本。相反,你会使用 cron 来调度这些任务周期性地执行,并把结果通过邮件发动给预先指定的接收者,或者将它们保存到使用 web 浏览器可以查看的文件中。

下面的脚本(filesystem_usage.sh)会运行有名的 df -h 命令,格式化输出到 HTML 表格并保存到 report.html文件中:

 
  1. #!/bin/bash
  2. # 演示使用 shell 脚本创建 HTML 报告的示例脚本
  3. # Web directory
  4. WEB_DIR=/var/www/html
  5. # A little CSS and table layout to make the report look a little nicer
  6. echo "<HTML>
  7. <HEAD>
  8. <style>
  9. .titulo{font-size: 1em; color: white; background:#0863CE; padding: 0.1em 0.2em;}
  10. table
  11. {
  12. border-collapse:collapse;
  13. }
  14. table, td, th
  15. {
  16. border:1px solid black;
  17. }
  18. </style>
  19. <meta http-equiv='Content-Type' content='text/html; charset=UTF-8' />
  20. </HEAD>
  21. <BODY>" > $WEB_DIR/report.html
  22. # View hostname and insert it at the top of the html body
  23. HOST=$(hostname)
  24. echo "Filesystem usage for host <strong>$HOST</strong><br>
  25. Last updated: <strong>$(date)</strong><br><br>
  26. <table border='1'>
  27. <tr><th class='titulo'>Filesystem</td>
  28. <th class='titulo'>Size</td>
  29. <th class='titulo'>Use %</td>
  30. </tr>" >> $WEB_DIR/report.html
  31. # Read the output of df -h line by line
  32. while read line; do
  33. echo "<tr><td align='center'>" >> $WEB_DIR/report.html
  34. echo $line | awk '{print $1}' >> $WEB_DIR/report.html
  35. echo "</td><td align='center'>" >> $WEB_DIR/report.html
  36. echo $line | awk '{print $2}' >> $WEB_DIR/report.html
  37. echo "</td><td align='center'>" >> $WEB_DIR/report.html
  38. echo $line | awk '{print $5}' >> $WEB_DIR/report.html
  39. echo "</td></tr>" >> $WEB_DIR/report.html
  40. done < <(df -h | grep -vi filesystem)
  41. echo "</table></BODY></HTML>" >> $WEB_DIR/report.html

在我们的 RHEL 7 服务器(192.168.0.18)中,看起来像下面这样:

服务器监视报告

服务器监视报告

你可以添加任何你想要的信息到那个报告中。添加下面的 crontab 条目在每天下午的 1:30 运行该脚本:

 
  1. 30 13 * * * /root/scripts/filesystem_usage.sh

总结

你很可能想起各种其他想要自动化的任务;正如你看到的,使用 shell 脚本能极大的简化任务。


本文来自云栖社区合作伙伴“Linux中国”,原文发布日期:2015-11-05

目录
相关文章
|
4天前
|
监控 Unix Shell
shell脚本编程学习
shell脚本编程
22 12
|
4天前
|
运维 Devops jenkins
自动化运维之路:从脚本到DevOps
【9月更文挑战第31天】在数字化时代的浪潮中,运维不再是单纯的系统维护,而是企业竞争力的加速器。本文将带你领略自动化运维的演变历程,从最初的脚本编写到现代DevOps实践的转变,揭示如何通过持续集成和持续交付(CI/CD)实现运维的高效与创新。我们将一起探索工具的选择、流程的优化以及文化的培养,让运维工作变得既简单又强大。
|
8天前
|
Shell
shell脚本变量 $name ${name}啥区别
shell脚本变量 $name ${name}啥区别
|
6天前
|
机器学习/深度学习 人工智能 运维
自动化运维的魔法:如何利用Python脚本提升工作效率
【9月更文挑战第29天】在数字时代的浪潮中,IT运维人员面临着前所未有的挑战和机遇。本文将通过深入浅出的方式,介绍自动化运维的基本概念、核心价值以及使用Python脚本实现自动化任务的方法。我们将从实际案例出发,探讨如何利用Python简化日常的系统管理任务,提高运维效率,并展望自动化运维的未来趋势。无论你是初学者还是有经验的运维专家,这篇文章都将为你开启一扇通往高效工作方式的大门。
10 2
|
8天前
|
运维 Ubuntu 应用服务中间件
自动化运维:使用Ansible进行配置管理和任务自动化
【9月更文挑战第27天】在现代IT基础设施中,自动化运维是提高效率、减少人为错误和确保系统一致性的关键。本文将介绍如何使用Ansible,一个流行的开源IT自动化工具,来简化日常的运维任务。我们将探索Ansible的核心概念,包括它的架构、如何安装和使用它,以及一些实际的使用案例。无论你是新手还是有经验的运维专家,这篇文章都会提供有价值的见解和技巧,以帮助你更好地利用Ansible实现自动化。
|
5天前
|
运维 监控 jenkins
自动化运维之路:从脚本到工具的演变
【9月更文挑战第29天】在数字化浪潮中,运维不再是简单的服务器管理。本文将带您穿越自动化运维的发展历程,揭示如何通过技术革新提升效率与可靠性。我们将探索自动化工具如何解放双手,实现快速部署、监控和故障恢复,最终达到高效运维的目标。
|
6天前
|
运维 监控 关系型数据库
自动化运维:编写基本的自动化脚本
自动化运维:编写基本的自动化脚本
9 1
|
9天前
|
Web App开发 存储 安全
Python编写脚本,打开浏览器输入网址,自动化登陆网站
Python编写脚本,打开浏览器输入网址,自动化登陆网站
15 4
|
5月前
|
Shell 索引
shell脚本入门到实战(四)- 数组
shell脚本入门到实战(四)- 数组
|
5月前
|
Shell
shell脚本入门到实战(三) - 变量
shell脚本入门到实战(三) - 变量
下一篇
无影云桌面