备案控制台

开发者社区云原生云消息队列正文

消息队列服务ONS产生10个G的僵死日志文件，版本是1.7.0.final

节前公司上线新版APP的时候，发现某些用户调用接口老是报错，一些用户却正常。排除代码的问题后，目光转向了环境,使用的机器是阿里云的服务器，df-h的时候发现了第一个磁盘被占满，一通操作发现了很诡异的事情： ONS的日志明明是64M的大小，但是却能产生10个G的僵死文件，RT：希望大手子能帮忙解答下疑问，每次重启后就能释放磁盘占用，但是没几天又会这样。

展开

收起

游客urfd563j75ltu 2020-10-09 13:39:54 852 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

遇到您描述的这种问题，通常可能是由于日志滚动策略未正确配置或者日志切割出现问题导致的。ONS（阿里云消息服务）在使用过程中，如果日志没有被定期清理或滚动，可能会产生大量旧日志文件占用磁盘空间，尤其是当存在僵死文件（如未被正常删除的日志备份文件）时，情况会更加严重。

以下是一些建议来解决和预防此类问题：

检查日志配置：首先确认您的应用日志配置是否设置了合理的日志滚动策略。例如，在Java应用中，如果您使用Logback或Log4j作为日志框架，需要确保配置文件中有正确的日志滚动策略（如按时间、大小滚动），并设置合理的保留周期和最大文件数量。
日志自动清理：在阿里云ECS服务器上，可以利用Cron定时任务或者使用云监控与事件规则结合函数计算等服务实现自动化清理。例如，编写脚本定期删除过期的日志文件，并通过Cron定时执行。
优化ONS客户端配置：检查ONS客户端配置，看是否有针对日志记录的特定设置，比如日志级别、输出路径等，根据实际情况调整以减少不必要的日志输出。
使用云产品功能：如果条件允许，考虑使用阿里云的日志服务SLS来收集和管理应用日志。SLS提供了自动化的日志存储、查询、分析以及生命周期管理功能，可以有效避免日志文件直接占用ECS磁盘空间的问题。
监控磁盘使用情况：利用阿里云ECS的监控服务，设置磁盘使用率的报警规则，一旦磁盘空间接近阈值，及时收到通知进行处理。
排查程序异常：虽然您提到已经排除了代码问题，但建议再次检查是否有潜在的内存泄漏或资源未释放的情况，这些也可能间接导致日志处理异常。
重启服务前清理：在每次计划重启服务之前，手动或通过脚本清理一次日志文件，确保重启后能从一个干净的状态开始。

通过上述措施，您可以有效地管理和控制日志文件的大小，避免因日志问题导致的磁盘空间不足。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

消息中间件日志服务

问答标签：

消息队列文件日志服务文件服务日志服务服务日志服务文件消息队列服务

问答地址：

开发者社区 > 云原生 > 云消息队列 > 问答

相关问答

Flink 文档中 sls connect 版本是不对么？

233

1

0

适用于Flink 1.17.0的SLS连接器版本号是多少呢？

152

2

0

flink1.17.0 读取 SLS 报错是对应的版本冲突么？

219

2

0

PolarDB-X 2.1版本支持日志分片的拆分，如何应用于电商的秒杀业务场景？

173

1

0

canal 1.1.8 版本 admin server状态断开，服务日志显示启动成功

344

1

0

Seata alibb版本多数据源插入 undo_l_log没有数据没有回滚，咋回事?

161

1

0

Redis 1.0中的list结构作为消息队列服务存在哪些主要的不足之处？

85

1

0

如何使用Java代码通过阿里云Log服务的SDK获取日志中的如下标签?

169

1

0

在阿里云的数据流转（DataHub）或消息队列（MQ）等服务中，`gmtCreate`表示什么？

118

0

0

云消息队列 Rocketmq 版基于哪个开源版本？

118

0

0

云原生

云消息队列

涵盖 RocketMQ、Kafka、RabbitMQ、MQTT、轻量消息队列(原MNS) 的消息队列产品体系，全系列产品 Serverless 化。RocketMQ 中文社区：https://rocketmq-learning.com/

我要提问

相关文章

数据一多就卡？别急，先把“数据入口”修好

开箱即用的 GoWind Admin｜风行，企业级前后端一体中后台框架：深度解析 Wire 依赖注入集成实践

三大电商API应用对比：淘宝京东拼多多谁能笑到最后？

AgentScope x RocketMQ：打造企业级高可靠 A2A 智能体通信基座

用 Flink 做实时 ETL：别只盯着算子，真正的灵魂是「语义、状态和扛事能力」

热门讨论

热门文章

请教下 mqtt连接成功了，能收到消息，后面又自动断开了连接，是什么情况？

为什么mqtt 连接一直显示 Not authorized to connect ？用的官网示例。

rocketmq 超过4M消息体怎么发送

rocketmq 5.0 dledgercontroller模式下日志是不会过期删除！

MQTT保持连接的话, 应该设置成多少?

rocketmq commitlog支持多盘部署吗

RocketMQ broker.conf acl 配置详解有吗？

在Apache RocketMQ中这种情况队列数量应该设置多少比较合理呢？

MQTT消息单包最大64k,但是我们现在有超过64k的数据，有的都到90k了，是什么原因呢?

重装系统后，无法通过云监控查看ecs资源占用

展开全部

利用消息队列MQTT，打造一款属于自己的IM社交软件

滴滴出行基于RocketMQ构建企业级消息队列服务的实践

消息队列ActiveMQ的使用详解

企业级 SpringBoot 教程-在springboot中用redis实现消息队列

RabbitMQ消息队列（九）：Publisher的消息确认机制

IM开发基础知识补课(五)：通俗易懂，正确理解并用好MQ消息队列

组队学架构之高并发架构系列：详解RPC远程调用和消息队列MQ的区别

突破Java面试(06)-如何保证消息队列的高可用性

laravel的消息队列剖析

消息队列入门（二）消息队列的规范和开源实现

展开全部

还有其他疑问?