运维编排场景系列-----定时清理Windows服务器日志

简介:

本文介绍在运维编排OOS的控制台,通过OOS服务下的定时运维功能,定时执行一个功能性模版,实现某些需定时管理服务器或定时管理其它服务的需求。

应用背景

运行中的实例内部运行了很多服务程序,随时间的推移系统会产生大量的日志文件或一些垃圾文件。其中产生的某些日志文件可能并无实际作用,时间久了产生越来越多的日志文件会占用实例中很大的存储空间,所以需要定期清理无用的日志文件,优化实例存储空间。

前提条件

  1. 实例状态为运行中Running

模版介绍:

模版功能:

  • 获取实例
  • 根据设置的时间天数,搜索到指定目录下模糊匹配的日志文件,来清理指定天数之前的匹配日志。(例如:清理5天前日志名称包含info.log.的所有日志。)

模版参数:

参数 说明 示例
LogFilePath 存放日志文件的绝对路径。 C:\Users\Administrator\testlogway
LogKeepTime 清理几天之前的日志文件。 5
Targets 根据实例标签(tags)或实例ID(InstanceId)选定需要的实例。 i-11111111111
RateControl 固定参数。
- 速率控制类型:并发控制
- 并发速率:1
- 最大错误次数:0
OOSAssumeRole 可选参数。
- (默认设置)当前账号的已有权限:执行您使用的账号的权限动作。请确保您拥有创建自定义镜像涉及的所有ECS API调用权限。
- 指定RAM角色,使用该角色的权限:如果指定了RAM角色名称,OOS扮演该RAM角色执行运维任务。
当前账号的已有权限

模版内容:

注:模版设置的测试删除的文件名为模糊匹配的方式,本模版匹配的名称为“ info.log. ”,请根据实际的日志文件名称更改模版内的需要删除文件的模糊名称。)

  FormatVersion: OOS-2019-06-01
  Description:
    en: Compared to the current time, specify the period of time to keep log files and delete log files outside the time period.
    zh-cn: 相比于当前时间,指定保留日志文件的时间段,并删除时间段之外的日志文件。
  Parameters:
    LogFilePath:
      Type: String
      Description:
        en: Log file storage location.
        zh-cn: 日志文件存放位置。
    LogKeepTime:
      Type: Number
      Description:
        en: How long to pre-retain log files compared to the current time.
        zh-cn: 相比于当前时间,预保留日志文件的时间天数。
      Default: 5
    Targets:
      Type: Json
      AssociationProperty: Targets
      AssociationPropertyMetadata:
        ResourceType: 'ALIYUN::ECS::Instance'
    RateControl:
      Description:
        en: Concurrency ratio of task execution.
        zh-cn: 任务执行的并发比率。
      Type: Json
      AssociationProperty: RateControl
      Default:
        Mode: Concurrency
        MaxErrors: 0
        Concurrency: 10
    OOSAssumeRole:
      Description: The RAM role to be assumed by OOS.
      Type: String
      Default: OOSServiceRole
  RamRole: '{{ OOSAssumeRole }}'
  Tasks:
    - Name: getInstance
      Description:
        en: Views the ECS instances.
        zh-cn: 获取ECS实例。
      Action: 'ACS::SelectTargets'
      Properties:
        ResourceType: 'ALIYUN::ECS::Instance'
        Filters:
          - '{{ Targets }}'
      Outputs:
        instanceIds:
          Type: List
          ValueSelector: 'Instances.Instance[].InstanceId'
    - Name: runCommand
      Action: 'ACS::ECS::RunCommand'
      Properties:
        commandContent: |-

          $pathExistOrNot = Test-Path -Path "{{ LogFilePath }}"
          if ($pathExistOrNot)
          {
              $timeOutDay = {{ LogKeepTime }}
              $filePath = "{{ LogFilePath }}"

              $allFile = Get-ChildItem -Path $filePath

              foreach($file in $allFile)
              {
                $daySpan = ((Get-Date) - $file.LastWriteTime).Days
                if ($daySpan -gt $timeOutDay -and $file.FullName.contains("info.log."))
                {
                    Remove-Item $file.FullName -Recurse -Force
                  echo "delete:" $file.FullName
                }
              }
          } else
          {
              echo "path not exist"
          }

        instanceId: '{{ ACS::TaskLoopItem }}'
        commandType: RunPowerShellScript
      Loop:
        Items: '{{ getInstance.instanceIds }}'
        RateControl: '{{ RateControl }}'
        Outputs:
          commandOutputs:
            AggregateType: 'Fn::ListJoin'
            AggregateField: commandOutput
      Outputs:
        commandOutput:
          Type: String
          ValueSelector: invocationOutput
  Outputs:
    commandOutput:
      Type: String
      Value: '{{ runCommand.commandOutputs }}'

模版执行效果:

  • 未执行上述模版前,实例内测试文件夹下的文件如下所示。1579498610739_7ed3b190_a220_46b5_9f1d_4bb084213fbd
  • 执行模版后测试文件下模糊匹配的日志文件全部被删除。1579500673309_a973c20c_00a4_4792_b977_fead3f279079

控制台操作步骤

步骤一:创建模版

  1. 请访问运维编排OOS的控制。单击我的模版,单击创建模板按钮,选取空白模板。将上述提供的模板粘贴到yaml栏,输入名称DeleteWindowsLogFile或自定义名称,点击创建模板1579511159765_e243904a_e16c_4026_b6be_bc39caeb5925

    1579509355472_d91ef3f1_37e8_4f64_b8d5_91f1d520d4dc

步骤二:设置定时触发及参数

  1. 单击定时运维,在定时运维内部,设置模版的执行周期频率。操作步骤如下图所示。1579501546739_7afefea8_84bd_499c_9d17_fd80be8a123b
  2. 选择模版下,选择我的模版,通过搜索框找到刚刚创建完成的模版。1579501846100_07782c68_8473_46c4_940d_56d3d3896908
  3. 在定时运维下的设置参数一栏,设置模版需要的参数。参数设置完成单击立即执行1579502141517_3e46ec3f_746c_447d_a9f9_a358a28b64a2

步骤三:查看执行运行情况

  1. 执行管理中查看创建的运维任务。1579502367712_7c2a5abb_a4fe_4dc9_af09_517381efa068

系列文章

主题文章

阿里云重磅发布云上自动化利器——运维编排OOS

最佳实践

玩转运维编排服务的权限:Assume Role+Pass Role
阿里云运维编排新功能:一键批量克隆ECS
批量在多台ECS内执行命令

场景系列

运维编排场景系列----更新ECS镜像
运维编排场景系列----给ECS实例自动打TAG
运维编排场景系列----从实例中拷贝文件到OSS
运维编排场景系列----给实例加到SLS机器组
运维编排场景系列----检测MFA功能状态
运维编排场景系列----每日统计多Region实例的运行状态
运维编排场景系列----如何使用jq
运维编排场景系列----分批到机器上运行命令
运维编排场景系列----更新镜像后自动更新伸缩配置镜像
运维编排场景系列----向Linux实例上传文件
运维编排场景系列----运行远端shell脚本
运维编排场景系列----在ECS实例上运行Ansible-playbook
运维编排场景系列----下载JVM堆栈到OSS
运维编排系列场景----将实例的固定公网IP转换为其它新EIP
运维编排场景系列----自动定时升级临时带宽
运维编排场景系列----批量更新云助手客户端
运维编排系列场景----批量释放实例
运维编排场景系列----ECS实例系统快照下载到本地
运维编排场景系列----批量更换系统盘
运维编排场景系列----自动创建多个区域同类型存储空间

相关实践学习
使用操作系统智能助手OS Copilot解锁操作系统运维与编程
在本实验场景中,将在阿里云ECS上体验OS Copilot产品。OS Copilot是阿里云操作系统团队基于大模型构建的OS智能助手。它具有自然语言问答、辅助命令执行、系统运维调优等功能,帮助用户更好地使用Linux,提升阿里云的使用体验。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://www.aliyun.com/product/ecs
相关文章
|
7月前
|
机器学习/深度学习 运维 监控
运维日志里的“读心术”:深度学习能看出啥?
运维日志里的“读心术”:深度学习能看出啥?
355 74
|
7月前
|
运维 监控 安全
EventLog Analyzer:高效的Web服务器日志监控与审计解决方案
ManageEngine EventLog Analyzer是一款企业级Web服务器日志监控与审计工具,支持Apache、IIS、Nginx等主流服务器,实现日志集中管理、实时威胁检测、合规报表生成及可视化分析,助力企业应对安全攻击与合规挑战,提升运维效率。
371 1
|
消息中间件 运维 监控
智能运维,由你定义:SAE自定义日志与监控解决方案
通过引入 Sidecar 容器的技术,SAE 为用户提供了更强大的自定义日志与监控解决方案,帮助用户轻松实现日志采集、监控指标收集等功能。未来,SAE 将会支持 istio 多租场景,帮助用户更高效地部署和管理服务网格。
653 51
|
11月前
|
存储 安全 Ubuntu
从Linux到Windows:阿里云服务器系统镜像适配场景与选择参考
阿里云为用户提供了丰富多样的服务器操作系统选择,以满足不同场景下的应用需求。目前,云服务器的操作系统镜像主要分为公共镜像、自定义镜像、共享镜像、镜像市场和社区镜像五大类。以下是对这些镜像类型的详细介绍及选择云服务器系统时需要考虑的因素,以供参考。
|
数据采集 运维 监控
数据采集监控与告警:错误重试、日志分析与自动化运维
本文探讨了数据采集技术从“简单采集”到自动化运维的演进。传统方式因反爬策略和网络波动常导致数据丢失,而引入错误重试、日志分析与自动化告警机制可显著提升系统稳定性与时效性。正方强调健全监控体系的重要性,反方则担忧复杂化带来的成本与安全风险。未来,结合AI与大数据技术,数据采集将向智能化、全自动方向发展,实现动态调整与智能识别反爬策略,降低人工干预需求。附带的Python示例展示了如何通过代理IP、重试策略及日志记录实现高效的数据采集程序。
562 7
数据采集监控与告警:错误重试、日志分析与自动化运维
|
存储 监控 API
【Azure App Service】分享使用Python Code获取App Service的服务器日志记录管理配置信息
本文介绍了如何通过Python代码获取App Service中“Web服务器日志记录”的配置状态。借助`azure-mgmt-web` SDK,可通过初始化`WebSiteManagementClient`对象、调用`get_configuration`方法来查看`http_logging_enabled`的值,从而判断日志记录是否启用及存储方式(关闭、存储或文件系统)。示例代码详细展示了实现步骤,并附有执行结果与官方文档参考链接,帮助开发者快速定位和解决问题。
325 22
|
运维 应用服务中间件 nginx
docker运维查看指定应用log文件位置和名称
通过本文的方法,您可以更高效地管理和查看Docker容器中的日志文件,确保应用运行状态可控和可监测。
2289 28
|
数据库连接 测试技术 Windows
【YashanDB知识库】windows配置ODBC跟踪日志, 使用日志定位问题
【YashanDB知识库】windows配置ODBC跟踪日志, 使用日志定位问题