crontab排查一例

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介:
首先QA部门反馈过来有70台机器在work用户下周期性定时任务无法执行,其他的400台服务器执行此命令没有问题,
crontab -e中写入:
44 */4 * * * `source /etc/profile;source /home/work/.bash_profile;/home/work/staf/extbin/atd/atdupdate`
首先我们从crontab入手,把此命令拿出来单独执行,没有问题。
第二:我把他得日志都打印到/home/work/xiaowei.log中,如下所示:
44 */4 * * * `source /etc/profile;source /home/work/.bash_profile;/home/work/staf/extbin/atd/atdupdate >>/home/work/xiaowei.log 2>&1`
这样暴露出几台机器因为/home/work空间不足写入不进文件中。查看命令:
[root@db-testing-ps1110.db01.alixi.com /]# du -sh /home/work  #s是汇总,h是以更优雅的方式显示
459G    /home/work
[root@db-testing-ps1110.db01.alixi.com /]# df -lh
Filesystem            Size  Used Avail Use% Mounted on
/dev/cciss/c0d0p2     8.7G  4.0G  4.7G  46% /
/dev/cciss/c0d0p3     462G  460G  2.2G 100% /home
这几台问题解决后,我们就开始看第二个问题:/home/work/xiaowei.log为空。
我们确认两点:
    第一:crond进程是否存在
    [root@db-testing-ps1110.db01.alixi.com /]# service crond status
    crond (pid 16924 2416) is running...
    第二:crontab中命令是否执行
    [root@db-testing-ps1110.db01.alixi.com /]# tail /var/log/cron
    Oct 13 14:09:01 db-testing-ps1110 crond[16712]: (work) CMD (`source /etc/profile;/home/work/staf/extbin/atd/atdupdate >>/home/work/xiaowei.log 2>&1`)
没有打日志出来,我们进行的操作是service crond restart 和service syslog restart 
这样我们又清理出一批机器出来。
          第三:确认命令问题:我们执行了一条最简单的命令:
    * * * * * mail -s "aaaaa" yangguoli@alixi.com </etc/passwd
    这样又把一批crontab本身有问题的筛选出来了。
    第四:命令的问题,我们通过分命令执行的方式:
    首先测试他的基本命令:/home/work/staf/extbin/atd/atdupdate能够打印出日志,然后测试source /etc/profile /home/work/staf/extbin/atd/atdupdate 也能打印出日志,但是把命令写全就打印不出日志了,说明问题出在source /home/work/.bash_profile中。
    
    找到这个文件有问题的地方修改掉,就好了。
    
    这里面说明了几个问题,大公司的机器底层软件比较混乱,程序是你灌我也灌,系统参数你改我也改,这个是由于产品上线频率和打补丁的频率很快,造成机器基础环境不统一。这里面最好有一个一键还原的意味在里面最好

 



本文转自guoli0813 51CTO博客,原文链接:http://blog.51cto.com/guoli0813/405163,如需转载请自行联系原作者

相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
11月前
|
SQL 数据挖掘 关系型数据库
阿里云百炼|析言GBI全新发布:联合云上数据库,助力企业轻松实现ChatBI
析言GBI是阿里云推出的一款基于AI的智能数据分析产品,通过自然语言处理实现对话式数据分析。用户无需编写代码,即可轻松进行数据查询、分析和可视化。该产品支持多种数据库连接方式(如MySQL、PostgreSQL等),并提供多版本选择以适应不同业务需求。即将发布的动态规划BI分析功能将进一步提升复杂问题的拆解与综合分析能力。欢迎访问阿里云百炼应用广场体验析言GBI,并享受200次免费问题额度。
|
存储 缓存 安全
ConcurrentHashMap的实现原理,非常详细,一文吃透!
本文详细解析了ConcurrentHashMap的实现原理,深入探讨了分段锁、CAS操作和红黑树等关键技术,帮助全面理解ConcurrentHashMap的并发机制。关注【mikechen的互联网架构】,10年+BAT架构经验倾囊相授。
ConcurrentHashMap的实现原理,非常详细,一文吃透!
|
编解码 BI API
气象数据下载网站整理
气象数据下载网站整理
1243 2
|
JSON IDE 开发工具
geojson乡镇拼接的说明
geojson乡镇拼接的说明
554 0
|
机器学习/深度学习 数据采集 搜索推荐
揭秘meta分析:如何提高临床医学决策?(一)
meta分析作为一种组织和综合临床医学研究结果的方法,具有重要的意义和应用价值[1]。它可以通过增加统计功效、强化证据水平、解决不一致性和提供全面综合性结论等优势,为临床决策制定提供科学、可靠的依据。然而,在进行meta分析时,需要注意研究质量和异质性等因素的考虑,并合理解释结果。通过合理应用meta分析方法,我们可以更好地利用现有的临床医学研究数据,并为患者提供更加个性化和精准的医疗服务。
395 0
|
Web App开发 JavaScript 前端开发
《JavaScript和jQuery实战手册(原书第2版)》——1.6节追踪错误
本节书摘来自华章社区《JavaScript和jQuery实战手册(原书第2版)》一书中的第1章,第1.6节追踪错误,作者:David Sawyer McFarland,更多章节内容可以访问云栖社区“华章社区”公众号查看
1390 0
|
20小时前
|
云安全 人工智能 自然语言处理