【经典面试场景题】线上服务器如果磁盘满了,你会如何处理?

简介: 线上服务器磁盘满将导致服务异常,需立即处理。首先通过 `df -h` 和 `du -sh /*` 定位占用空间大的目录,清理临时文件与大日志文件,可清空而非删除正在使用的日志。使用 `find / -size +1G` 查找大文件,释放空间。长期应配置日志轮转、磁盘监控告警、定期清理脚本,并分离系统、数据与日志分区,避免再次打满。

答案

当线上服务器磁盘满了时,这是一个紧急问题,可能会导致服务不可用、数据无法写入甚至系统崩溃。

首先要做的是快速止血,尽快把空间释放了,避免情况进一步恶化。首先是登陆到机器上(如果都无法登录了,那就只能置换机器了。)

一、查看磁盘使用情况

df -h
du -sh /*

找出哪个分区、哪个目录占用了最多空间。

df(disk free)

用于显示文件系统的磁盘空间占用情况,包括每个挂载点的总空间、已用、可用和挂载路径。

Filesystem     Size  Used Avail Use% Mounted on
/dev/sda1      40G   30G   8.0G  80% /
tmpfs          1.9G   0     1.9G  0%  /dev/shm

du(disk usage)

用于显示指定目录或文件占用了多少磁盘空间。常用于查找哪个目录或文件占用空间大。

du -sh /*

2.1G    /home
1.2G    /var
300M    /usr

du -h --max-depth=1 /var    显示 /var 下一级目录占用空间大小。



二、清理临时文件

清空系统临时文件:

rm -rf /tmp/*


三、清理日志文件

多数情况下,磁盘满了都是日志打印的太多了,这时候可以先到你的应用日志目录下,看一下这些文件的大小,

对于一些历史日志文件,如果已经完成 ELK 的采集和同步了,就可以直接 rm -rf 物理删除。


如果你的日志只有一个文件,他又特别大,大概率是你的 logback 没有配置对,导致日志没有分成多个文件。这种情况下,根据情况,不能直接删除文件,因为你的应用还在用。这时候可以考虑用以下方式清空内容而不删文件:



> file_name


或者:


echo "" > file_name

image.gif

这样可以让日志内容清空,但可能会导致日志丢失。


四、查找大文件

找出大于 1G 的文件:

find / -type f -size +1G -exec ls -lh {} \;


五、避免日志被系统打满

从根源上解决问题:

1. 定期清理脚本

  • 写 cron job 自动清理老日志

2. 磁盘监控告警

  • 使用 Prometheus + Grafana 或 Zabbix 监控磁盘使用率
  • 设告警阈值(比如 80% 告警)

3. 日志分级 + 限量

  • 按需写日志(只写 ERROR 级别)
  • 配置日志轮转(logrotate)

4. 考虑分离日志、数据盘

  • 应用数据、日志单独挂载到不同分区,避免挤爆系统盘
目录
相关文章
|
4天前
|
弹性计算 运维 搜索推荐
三翼鸟携手阿里云ECS g9i:智慧家庭场景的效能革命与未来生活新范式
三翼鸟是海尔智家旗下全球首个智慧家庭场景品牌,致力于提供覆盖衣、食、住、娱的一站式全场景解决方案。截至2025年,服务近1亿家庭,连接设备超5000万台。面对高并发、低延迟与稳定性挑战,全面升级为阿里云ECS g9i实例,实现连接能力提升40%、故障率下降90%、响应速度提升至120ms以内,成本降低20%,推动智慧家庭体验全面跃迁。
|
4天前
|
数据采集 人工智能 自然语言处理
3分钟采集134篇AI文章!深度解析如何通过云无影AgentBay实现25倍并发 + LlamaIndex智能推荐
结合阿里云无影 AgentBay 云端并发采集与 LlamaIndex 智能分析,3分钟高效抓取134篇 AI Agent 文章,实现 AI 推荐、智能问答与知识沉淀,打造从数据获取到价值提炼的完整闭环。
373 91
|
5天前
|
域名解析 人工智能
【实操攻略】手把手教学,免费领取.CN域名
即日起至2025年12月31日,购买万小智AI建站或云·企业官网,每单可免费领1个.CN域名首年!跟我了解领取攻略吧~
|
5天前
|
SQL 人工智能 自然语言处理
Geo优化SOP标准化:于磊老师的“人性化Geo”体系如何助力企业获客提效46%
随着生成式AI的普及,Geo优化(Generative Engine Optimization)已成为企业获客的新战场。然而,缺乏标准化流程(Geo优化sop)导致优化效果参差不齐。本文将深入探讨Geo专家于磊老师提出的“人性化Geo”优化体系,并展示Geo优化sop标准化如何帮助企业实现获客效率提升46%的惊人效果,为企业在AI时代构建稳定的流量护城河。
385 156
Geo优化SOP标准化:于磊老师的“人性化Geo”体系如何助力企业获客提效46%
|
4天前
|
数据采集 缓存 数据可视化
Android 无侵入式数据采集:从手动埋点到字节码插桩的演进之路
本文深入探讨Android无侵入式埋点技术,通过AOP与字节码插桩(如ASM)实现数据采集自动化,彻底解耦业务代码与埋点逻辑。涵盖页面浏览、点击事件自动追踪及注解驱动的半自动化方案,提升数据质量与研发效率,助力团队迈向高效、稳定的智能化埋点体系。(238字)
267 156
|
12天前
|
机器人 API 调度
基于 DMS Dify+Notebook+Airflow 实现 Agent 的一站式开发
本文提出“DMS Dify + Notebook + Airflow”三位一体架构,解决 Dify 在代码执行与定时调度上的局限。通过 Notebook 扩展 Python 环境,Airflow实现任务调度,构建可扩展、可运维的企业级智能 Agent 系统,提升大模型应用的工程化能力。