踩坑之路 - 日志配置错误导致日志丢失

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 原起在排查一个问题时,发现本应该每天定时执行的日志,在某些日期居然没有,中间的 11.26 、11.28、11.30 的日志呢? 查看同样代码的 打的 A 日志文件,日志均匀,每天都有B 文件的日志为什么某些天丢失了? (这些日志文件本来是做数据对账的,比较重要)分析第一时间反应会不会是踩了 SLS 中间件 日志搜集上传的坑?开始登录机器去查看 A 和 B 当天的日志文件,发现 当天打印 A 日志

原起

在排查一个问题时,发现本应该每天定时执行的日志,在某些日期居然没有,中间的 11.26 、11.28、11.30 的日志呢? 

查看同样代码的 打的 A 日志文件,日志均匀,每天都有

B 文件的日志为什么某些天丢失了? (这些日志文件本来是做数据对账的,比较重要)

分析

  1. 第一时间反应会不会是踩了 SLS 中间件 日志搜集上传的坑?

开始登录机器去查看 A 和 B 当天的日志文件,发现 当天打印 A 日志的机器,确实没有打印 B 日志,奇怪了 。 

  1. logback 日志打印丢失了? 查看 B 日志的日志配置 和 机器日志清单

tail -200 查看最后 200 行 out_user.log 后发现,日志停留在了 11月25号,已经停止更新 5 天了。

定位

已经怀疑到了是日志滚动问题,查了问题日志文件的 logback 配置:

而本项目中正常打印日志的的logback 配置如下: 

这样对比来看,一下就猜测性的定位了问题 , 有人将 SizeAndTimeBasedRollingPolicy的 fileNamePattern 拷贝到了 FixedWindowRollingPolicy 

而FixedWindowRollingPolicy 的 滚动策略配置了 %d{yyyy-MM-dd} 样式的在滚动代码执行时估计异常了

验证:将模板修改为  ${OUT_USER_FILE}.%i.log 后发现问题解决。

深究

为了搞清楚错误的原因,简单分析源码后,在关键位置打上断点

 ch.qos.logback.core.rolling.helper.FileNamePattern 第 66 行,看 parse 方法第 65 行的结果:  

如图所示,logback 中自制的分词器将 biz-%d{yyyy-MM-dd_HH}.%i.txt 解析成了 tokenList。

接下来代码执行到第 67 行,看一下 Node 的结果:

 

%d{yyyy-MM-dd_HH} 和 %i 被解析成了关键字,其他则保持字面值。

关键字 d 和 i 对应不同的转换器:

    static final Map<String, String> CONVERTER_MAP = new HashMap<String, String>();
    static {
        // i 对应 IntegerTokenConverter
        CONVERTER_MAP.put(IntegerTokenConverter.CONVERTER_KEY, IntegerTokenConverter.class.getName());
        // d 对应 DateTokenConverter
        CONVERTER_MAP.put(DateTokenConverter.CONVERTER_KEY, DateTokenConverter.class.getName());
    }

又因为 FixedWindowRollingPolicy 产生的参数值只有 Integer 型的,所以遇到 %d{yyyy-MM-dd_HH} 就会出错了 

总结

很多时候,我们在编写日志配置时,往往都死直接COPY 或者 照猫画虎 , 一不小心就会配置错误,然后 logback-core 并不会在这里做异常配置启动检测,或者做 try catch 处理这个小错误 。 

而日志丢失问题可大可小,如果正好赶上问题排查的关键日志丢失,可能让排查问题的过程非常痛苦,另外如果赶上业务操作日志等重要举证内容,技术同学的说服力大大降低; 

挡路牌指示语: 

 FixedWindowRollingPolicy 策略的  fileNamePattern 不能包含 %d{yyyy-MM-dd}  

补坑:

该问题在 logback 官方确定为 bug , Issues 链接: https://jira.qos.ch/browse/LOGBACK-1293  

想要完全规避该问题,需要将 logback-core 的版本升级到 1.4.6 以上 ;

相关实践学习
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
相关文章
|
1月前
|
监控 安全 程序员
Python日志模块配置:从print到logging的优雅升级指南
从 `print` 到 `logging` 是 Python 开发的必经之路。`print` 调试简单却难维护,日志混乱、无法分级、缺乏上下文;而 `logging` 支持级别控制、多输出、结构化记录,助力项目可维护性升级。本文详解痛点、优势、迁移方案与最佳实践,助你构建专业日志系统,让程序“有记忆”。
215 0
|
2月前
|
缓存 Java 应用服务中间件
Spring Boot配置优化:Tomcat+数据库+缓存+日志,全场景教程
本文详解Spring Boot十大核心配置优化技巧,涵盖Tomcat连接池、数据库连接池、Jackson时区、日志管理、缓存策略、异步线程池等关键配置,结合代码示例与通俗解释,助你轻松掌握高并发场景下的性能调优方法,适用于实际项目落地。
529 5
|
8月前
|
SQL Java 数据库连接
微服务——SpringBoot使用归纳——Spring Boot使用slf4j进行日志记录—— application.yml 中对日志的配置
在 Spring Boot 项目中,`application.yml` 文件用于配置日志。通过 `logging.config` 指定日志配置文件(如 `logback.xml`),实现日志详细设置。`logging.level` 可定义包的日志输出级别,例如将 `com.itcodai.course03.dao` 包设为 `trace` 级别,便于开发时查看 SQL 操作。日志级别从高到低为 ERROR、WARN、INFO、DEBUG,生产环境建议调整为较高级别以减少日志量。本课程采用 yml 格式,因其层次清晰,但需注意格式要求。
798 0
|
安全 BI 网络安全
EventLog Analyzer 如何满足等保合规要求?密码有效期、产品日志保留、配置备份三大核心问题全面解答
EventLog Analyzer(ELA)助力企业满足网络安全等级保护要求,支持配置自动/手动备份、日志180天留存及密码策略管理,提升合规性与安全运营效率。
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
3561 31
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
4月前
|
JSON 安全 Go
Go语言项目工程化 —— 日志、配置、错误处理规范
本章详解Go语言项目工程化核心规范,涵盖日志、配置与错误处理三大关键领域。在日志方面,强调其在问题排查、性能优化和安全审计中的作用,推荐使用高性能结构化日志库zap,并介绍日志级别与结构化输出的最佳实践。配置管理部分讨论了配置分离的必要性,对比多种配置格式如JSON、YAML及环境变量,并提供viper库实现多环境配置的示例。错误处理部分阐述Go语言显式返回error的设计哲学,讲解标准处理方式、自定义错误类型、错误封装与堆栈追踪技巧,并提出按调用层级进行错误处理的建议。最后,总结各模块的工程化最佳实践,助力构建可维护、可观测且健壮的Go应用。
|
5月前
|
存储 NoSQL MongoDB
Docker中安装MongoDB并配置数据、日志、配置文件持久化。
现在,你有了一个运行在Docker中的MongoDB,它拥有自己的小空间,对高楼大厦的崩塌视而不见(会话丢失和数据不持久化的问题)。这个MongoDB的数据、日志、配置文件都会妥妥地保存在你为它精心准备的地方,天旋地转,它也不会失去一丁点儿宝贵的记忆(即使在容器重启后)。
639 4
|
7月前
|
存储 监控 API
【Azure App Service】分享使用Python Code获取App Service的服务器日志记录管理配置信息
本文介绍了如何通过Python代码获取App Service中“Web服务器日志记录”的配置状态。借助`azure-mgmt-web` SDK,可通过初始化`WebSiteManagementClient`对象、调用`get_configuration`方法来查看`http_logging_enabled`的值,从而判断日志记录是否启用及存储方式(关闭、存储或文件系统)。示例代码详细展示了实现步骤,并附有执行结果与官方文档参考链接,帮助开发者快速定位和解决问题。
233 22
|
8月前
|
监控 Shell Linux
Android调试终极指南:ADB安装+多设备连接+ANR日志抓取全流程解析,覆盖环境变量配置/多设备调试/ANR日志分析全流程,附Win/Mac/Linux三平台解决方案
ADB(Android Debug Bridge)是安卓开发中的重要工具,用于连接电脑与安卓设备,实现文件传输、应用管理、日志抓取等功能。本文介绍了 ADB 的基本概念、安装配置及常用命令。包括:1) 基本命令如 `adb version` 和 `adb devices`;2) 权限操作如 `adb root` 和 `adb shell`;3) APK 操作如安装、卸载应用;4) 文件传输如 `adb push` 和 `adb pull`;5) 日志记录如 `adb logcat`;6) 系统信息获取如屏幕截图和录屏。通过这些功能,用户可高效调试和管理安卓设备。
|
8月前
|
数据库连接 测试技术 Windows
【YashanDB知识库】windows配置ODBC跟踪日志, 使用日志定位问题
【YashanDB知识库】windows配置ODBC跟踪日志, 使用日志定位问题

热门文章

最新文章

下一篇
oss云网关配置