[运维日志] Web 服务器日志依日期归档(Powershell 实现,附源代码)

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: [运维日志] Web 服务器日志依日期归档(Powershell 实现,附源代码)

[运维日志] Web 服务器日志依日期归档


1.概述

本文记录了一个以 Jboss 服务器日志归档的 powershell 示范项目。该项目只需要略加修改,即可用于所有类似需要归档日志的场景。

Jboss 是一个Java Web 框架,在 Jboss Web 服务器运行期间,默认会生成许多server.log日志文件,你可以在 Jboss中设置每个 server.log 的最大大小,这样每当一个日志文件写满后,将后缀依次添加.1.2…以示区别,知道到达设置的最大日志文件个数后,将其删除。

在某些场景下,我们不希望有过多的大日志文件,或者希望在有限的服务器磁盘上存储更多的日志,以备保留服务器在生产运行下的某些重要信息,这个时候我们就需要对日志进行压缩归档,让日志文件更小,并且不至于被过早地由系统自动删除。

7zip 是一款不错的压缩软件,目前在WindowsLinux以及macOS上都有相应官方版本,它以极高的压缩比例独步武林,尤其适合压缩文本文件,往往一份纯文本日志能压缩到百分之一到百分之二左右。

在我的另外一篇博文《案例详解-如何在 Linux 系统中安装和使用 7zip 以及 7zip的脚本编程使用教程》https://blog.csdn.net/qq_28550263/article/details/124876070 详细介绍了7zip的命令行使用方式,并提供了一个基于7zip官方给出的可执行文件而制作的.deb安装包。你也可以在7zip官网https://www.7-zip.org/找到并下载其他平台的版本。

我们通过 powershell 查询管理指定目录中的server.log.x文件,并通过powershell调用 7zip 软件提供的命令进行极限压缩,按照归档日期时间,自动地将写满的日志文件归档到一个指定的历史日志目录下。

2. Readme 文档 - VCS服务器 Jboss 日志压缩脚本

2.1 功能概述

该脚本用于压缩并清理 正在写入的 VCS JBOSS server.log 日志。

2.2 项目结构

└─zip_log_script            # 项目根目录
    ├─history_logs          # 历史日志压缩归档目录
    │  └─2022-06-08           # 某天被归档的目录,将由程序自动生成,当天归档压缩包放在其中
    |  └─ ...                 # ...
    |  └─ ...                 
    └─programs              # 脚本目录
        ├─log               # 空目录,存在只是为了程序运行
        └─utils             # 工具集目录,存放主程序运行需要的东西
        └─zip_logs.ps1      # 主程序

2.3 清理逻辑

->1

JBOSS 当前默认写入的文件为 server.log,当此文件写入到配置大小后,将会被赋予后缀 .1.2.3… 即 server.log.1server.log.2server.log.3…。

脚本读取 路径变量 $JBoss_LOG_DIR 中指定的路径(默认为"D:\orca\jboss\server\ORCA\log")下的所有文件,不包含该路径下的子路径。这个路径下存放了 1 处所述的 server.log.x。由于该文件夹下同时存放了其它文件,因此取出文件名包含 server 但非 server.log 的日志,有多少个取多少个。

无需要压缩的归档文件

如果在 路径变量 $JBoss_LOG_DIR 指定的目录中没有需要压缩的文件,比如刚刚完成前一次归档,JBOSS 还没有生成新的日志,那么即使你运行日志也不会执行任何归档操作,并且你将看到形如以下提示:

2022-06-08 03:22:04 [DEBUG] There are currently no logs need to archive.

2.4 程序运行环境依赖

脚本的运行需要安装有 powershell 以及 7zip 软件,同时两个软件的主目录在系统的 Path 环境变量中。Windows 系统中已经默认安装好了 powershell 并添加到环境变量,只需要更改powershell脚本执行策略,即已管理员身份打开 powershell 窗口输入并执行以下代码:

Set-ExecutionPolicy Unrestricted

关于 7zip 软件,由于安装完成后不会自动添加环境变量,如果系统上已经安装了该软件,则只需要手动在 Windows 高级系统设置中添加到 Path 边境变量中即可。

2.5 运行方式

可以手动运行,假设你位于该项目项目根目录下:

powershell ./programs/zip_logs.ps1

或者直接双击根目录下的Run.cmd

也可以添加到 Windows 任务计划,指定每天运行多次。

2.6 压缩级别

采用7z极限压缩,对于纯文本压缩后的大小可为压缩前的百分之一左右,因此可以大大节省日志在磁盘中的存储空间。

3. 项目源代码

主程序:zip_log_script

#*****************************************************************************
# Copyright Jack Lee. All rights reserved.
# Licensed under the MIT License.
# Email: 291148484@163.com
# https://blog.csdn.net/qq_28550263?spm=1001.2101.3001.5343
#*****************************************************************************
using module .\utils\jcpath.psm1
using module .\utils\jclogger.psm1
$JBoss_LOG_DIR = "D:\orca\jboss\server\ORCA\log"
$BASE_DIR = (Get-Location).Path
$OUTPUT_DIR = [Path]::Join($BASE_DIR,'history_logs')
$PROGRAM_DIR = [Path]::Join($BASE_DIR,'programs')
$SavePath = [Path]::Join(
    $PROGRAM_DIR,
    'log'
)
$logger = [Logger]::new($SavePath);
$ArchiveName = (Get-Date -Format 'yyyy-MM-dd-HH-mm-ss')+".7z"
$Date_dir_name =  [Path]::Join($OUTPUT_DIR, (Get-Date -Format 'yyyy-MM-dd'))
$order = '7z a -mx9 -sdel '+ [Path]::Join($Date_dir_name, $ArchiveName)+' '
$order_sub = ""
foreach ($file in [Path]::get_items($JBoss_LOG_DIR) ) {
    $basename = [Path]::basename($file)
    if($basename.Contains('server') -and ($basename -ne 'server.log')){
        $logger.Info('The current log file found is: '+$basename)
        $order_sub = $order_sub + [Path]::Join($JBoss_LOG_DIR, $file) + ' '
    }
}
if($order_sub -ne ""){
    $logger.Info('Making compressed package and deleting the original log.')
    powershell -Command ($order + $order_sub)
    $logger.Info('All down')
}else{
    $logger.Debug("There are currently no logs need to archive.")
}

模块 jcpath.psm1

请参考我的博客:

【运维】PowerShell编程 目录文件相关方法的封装与案例详解https://blog.csdn.net/qq_28550263/article/details/124378032

在全文末尾的附录部分给出了这部分代码。

模块 jclogger.psm1

[运维技术]PowerShell中实现一个最基本的日志器loggerhttps://blog.csdn.net/qq_28550263/article/details/124024540

文中章节 2. 代码实现 部分给出了这部分代码。

其中,32行$logmessages >> $this.SavePath,若该归档脚本本身不希望输出任何日志,则可以注释掉。


附: 参考博文链接汇总

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
3天前
|
存储 运维 监控
API明细日志及运维统计日志全面提升API可运维性
在数字化转型的大潮中,数据已成为企业最宝贵的资产之一。而数据服务API可快速为数据应用提供数据接口。面对越来越多的API以及越来越多的应用调用,如何快速查看API的服务情况、异常情况及影响范围,以及查看API的调用详情,进行API的性能优化、错误排查变得越来越重要,本文将介绍如何配置和开通API运维统计及明细日志,以及如何查看日志进行介绍。
|
7天前
|
SQL Oracle 关系型数据库
【赵渝强老师】Oracle的控制文件与归档日志文件
本文介绍了Oracle数据库中的控制文件和归档日志文件。控制文件记录了数据库的物理结构信息,如数据库名、数据文件和联机日志文件的位置等。为了保护数据库,通常会进行控制文件的多路复用。归档日志文件是联机重做日志文件的副本,用于记录数据库的变更历史。文章还提供了相关SQL语句,帮助查看和设置数据库的日志模式。
【赵渝强老师】Oracle的控制文件与归档日志文件
|
1月前
|
存储 数据采集 分布式计算
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
Hadoop-17 Flume 介绍与环境配置 实机云服务器测试 分布式日志信息收集 海量数据 实时采集引擎 Source Channel Sink 串行复制负载均衡
44 1
|
1月前
|
分布式计算 资源调度 数据可视化
Hadoop-06-Hadoop集群 历史服务器配置 超详细 执行任务记录 JobHistoryServer MapReduce执行记录 日志聚合结果可视化查看
Hadoop-06-Hadoop集群 历史服务器配置 超详细 执行任务记录 JobHistoryServer MapReduce执行记录 日志聚合结果可视化查看
36 1
|
30天前
|
运维 监控 数据可视化
出海运维日志通到底重要不重要?
出海运维日志通到底重要不重要?
|
2月前
|
关系型数据库 MySQL 应用服务中间件
服务器端日志在哪里
服务器端日志在哪里
|
3月前
|
Ubuntu Linux 测试技术
在Linux中,已知 apache 服务的访问日志按天记录在服务器本地目录/app/logs 下,由于磁盘空间紧张现在要求只能保留最近7天的访问日志,请问如何解决?
在Linux中,已知 apache 服务的访问日志按天记录在服务器本地目录/app/logs 下,由于磁盘空间紧张现在要求只能保留最近7天的访问日志,请问如何解决?
|
3月前
|
存储 运维 监控
监控与日志管理:保障系统稳定运行与高效运维的基石
【8月更文挑战第16天】监控与日志管理是保障系统稳定运行和高效运维的基石。它们不仅能够帮助企业及时发现并解决问题,还能够为性能调优、资源优化和业务决策提供有力支持。因此,在构建系统架构时,企业应高度重视监控与日志管理的规划和实施,确保它们能够充分发挥作用,为企业的发展保驾护航。同时,随着技术的不断进步和应用场景的不断拓展,监控与日志管理也将持续演进和创新,为企业带来更多的价值和便利。
|
3月前
|
运维 分布式计算 DataWorks
DataWorks产品使用合集之运维中心中的运行日志可以保留多久
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
3月前
|
SQL Oracle NoSQL
实时计算 Flink版操作报错合集之报错“找不到对应的归档日志文件”,怎么处理
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。