日志管理与分析

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 本书是国产日志易团队按照主流的日志管理系统的实践来写的,讲解了日志分析的基本概念、法律法规、技术选型、采集和解析、存储、告警、可视化以及智能运维。
ISBN: 978-7-121-40632-4
编著:日志易学院
页数:198页
阅读时间:2022-09-25
推荐指数:★★★★☆

本书是国产日志易团队按照主流的日志管理系统的实践来写的,
讲解了日志分析的基本概念、法律法规、技术选型、采集和解析、存储、告警、可视化以及智能运维。

日志管理与分析

日志生态系统(日志基础设施),是实现日志数据的生成、过滤、格式化、分析和长期存储等功能的生态系统。
日志的作用:故障排查、数据分析、安全合规审计、内网安全监控、智能运维。
日志需要告诉运维人员:发生了什么?何时发生的?发生于何处?谁参与其中?参与者来源。
日志使用误区

  1. 不记录日志
  2. 不查看日志
  3. 保留时间过短(至少6个月)
  4. 优先级(等级)
  5. 只收集单一日志
  6. 只搜索已知错误

道:本质是什么?
术:解决问题的方法是什么?
器:工具。

日志采集一般有两种模式:推送和拉取
数据清洗不只是数据修剪,也要增加额外的数据标识
采集数据的时候需要注意个人数据,涉及到隐私数据需要*处理。

日志优先级:
ALL:最低,打开所有日志记录。
TRACE:低日志等级,追踪用。
DEBUG:调试日志用。
INFO:生产环境输出。
WARN:警告,不是错误!
ERROR:错误信息,并不会影响系统继续运行。
FATAL:严重错误,导致系统退出。
OFF:关闭所有日志。

日志存储方式:
一、数据库存储(MySQL)
优点:易用、权限控制和备份恢复、方便部署。
缺点:读写耗时、查询速度有限、删除开销大、存在数据丢失风险。

二、分布式存储(Hadoop)
优点:易扩展、大规模、高吞吐量、容错性、硬件要求低。
缺点:二次开发、访问延时。

三、文件检索系统(Elasticsearch)

倒排序索引,认为是不可变的,所以不用上锁,因而能提升并发能力。
通常包含: DocID文档id、 TF单词频率、 Positing位置、 Offset偏移量。

优点:查找速度快、并发强、节省CPU、IO开销。
缺点:创建索引耗时、维护成本高。

四、云存储
优点:方便存储访问、方便扩容、降低成本、容灾备份。
缺点:读写速度受网络影响、数据安全性不高。

RESTful API
GET:从服务器中取出资源。
POST:在服务器中新建资源。
PUT:在服务器中更新资源(完整的数据)。
PATCH:在服务器中更新资源(需要修改的数据)。
DELETE:从服务器中删除资源。

智能运维:异常检测、根因分析、日志分析、告警收敛、趋势预测。
三西格玛(3sigma):是一种经典的异常检测算法,他通过对历史数据计算均值和方差来判断待检测数据是否在合理范围内。
ARIMA模型:差分整合移动平均回归模型,是一种经典的统计学模型,他通过计算历史数据的一些统计学特征来预测未来数据。
孤立森林算法:基于决策树森林的集成算法,他是无监督算法。先训练出决策树,然后投票是否存在异常。
滑动平均算法:基于数值的简单阀值算法,通过比较滑动窗口内平均值的某种关系(比值、差分等)的历史分布,判断数据是否在合理的范围内波动,是否产生了历史习惯外的波动情况。
GBRT:梯度增强回归树算法是基于增强思想的决策树森林算法,他是有监督算法。增强孤立森林算法,优化改进之前的决策结果。
核密度分析:KDE是一种基于历史数据分布的无监督算法。在时序数据异常检测中,将数据输入模型,得到数据的异常分数。
条件变分自编码器:CVAE是一种涉及神经网络的机器学习算法。在时序数据异常检测中将输入数据窗口化,通过编码器映射为维度更低的隐变量,再由解码器进行复原,如果复原出的数据和原始数据接近程度高,说明输入数据的模式是正常的,反之则是异常。

相关实践学习
通过日志服务实现云资源OSS的安全审计
本实验介绍如何通过日志服务实现云资源OSS的安全审计。
目录
相关文章
|
1月前
|
监控 安全 搜索推荐
使用EventLog Analyzer进行日志取证分析
EventLog Analyzer助力企业通过集中采集、归档与分析系统日志及syslog,快速构建“数字犯罪现场”,精准追溯安全事件根源。其强大搜索功能可秒级定位入侵时间、人员与路径,生成合规与取证报表,确保日志安全防篡改,大幅提升调查效率,为执法提供有力证据支持。
|
6月前
|
存储 运维 监控
SelectDB 实现日志高效存储与实时分析,完成任务可领取积分、餐具套装/水杯/帆布包!
SelectDB 实现日志高效存储与实时分析,完成任务可领取积分、餐具套装/水杯/帆布包!
|
6月前
|
SQL 监控 数据挖掘
SLS 重磅升级:超大规模数据实现完全精确分析
SLS 全新推出的「SQL 完全精确」模式,通过“限”与“换”的策略切换,在快速分析与精确计算之间实现平衡,满足用户对于超大数据规模分析结果精确的刚性需求。标志着其在超大规模日志数据分析领域再次迈出了重要的一步。
512 117
|
3月前
|
监控 安全 NoSQL
【DevOps】Logstash详解:高效日志管理与分析工具
Logstash是ELK Stack核心组件之一,具备强大的日志收集、处理与转发能力。它支持多种数据来源,提供灵活的过滤、转换机制,并可通过插件扩展功能,广泛应用于系统日志分析、性能优化及安全合规等领域,是现代日志管理的关键工具。
530 0
|
5月前
|
自然语言处理 监控 安全
阿里云发布可观测MCP!支持自然语言查询和分析多模态日志
阿里云可观测官方发布了Observable MCP Server,提供了一系列访问阿里云可观测各产品的工具能力,包含阿里云日志服务SLS、阿里云应用实时监控服务ARMS等,支持用户通过自然语言形式查询
604 0
阿里云发布可观测MCP!支持自然语言查询和分析多模态日志
|
4月前
|
人工智能 运维 监控
Aipy实战:分析apache2日志中的网站攻击痕迹
Apache2日志系统灵活且信息全面,但安全分析、实时分析和合规性审计存在较高技术门槛。为降低难度,可借助AI工具如aipy高效分析日志,快速发现攻击痕迹并提供反制措施。通过结合AI与学习技术知识,新手运维人员能更轻松掌握复杂日志分析任务,提升工作效率与技能水平。
|
7月前
|
存储 消息中间件 缓存
MiniMax GenAI 可观测性分析 :基于阿里云 SelectDB 构建 PB 级别日志系统
基于阿里云SelectDB,MiniMax构建了覆盖国内及海外业务的日志可观测中台,总体数据规模超过数PB,日均新增日志写入量达数百TB。系统在P95分位查询场景下的响应时间小于3秒,峰值时刻实现了超过10GB/s的读写吞吐。通过存算分离、高压缩比算法和单副本热缓存等技术手段,MiniMax在优化性能的同时显著降低了建设成本,计算资源用量降低40%,热数据存储用量降低50%,为未来业务的高速发展和技术演进奠定了坚实基础。
311 1
MiniMax GenAI 可观测性分析 :基于阿里云 SelectDB 构建 PB 级别日志系统
|
7月前
|
SQL 存储 自然语言处理
让跨 project 联查更轻松,SLS StoreView 查询和分析实践
让跨 project 联查更轻松,SLS StoreView 查询和分析实践
142 1
|
9月前
|
机器学习/深度学习 人工智能 运维
智能日志分析:用AI点亮运维的未来
智能日志分析:用AI点亮运维的未来
2855 15
|
9月前
|
SQL 关系型数据库 MySQL
MySQL事务日志-Undo Log工作原理分析
事务的持久性是交由Redo Log来保证,原子性则是交由Undo Log来保证。如果事务中的SQL执行到一半出现错误,需要把前面已经执行过的SQL撤销以达到原子性的目的,这个过程也叫做"回滚",所以Undo Log也叫回滚日志。
403 7
MySQL事务日志-Undo Log工作原理分析

热门文章

最新文章