日志管理与分析

简介: 本书是国产日志易团队按照主流的日志管理系统的实践来写的,讲解了日志分析的基本概念、法律法规、技术选型、采集和解析、存储、告警、可视化以及智能运维。
ISBN: 978-7-121-40632-4
编著:日志易学院
页数:198页
阅读时间:2022-09-25
推荐指数:★★★★☆

本书是国产日志易团队按照主流的日志管理系统的实践来写的,
讲解了日志分析的基本概念、法律法规、技术选型、采集和解析、存储、告警、可视化以及智能运维。

日志管理与分析

日志生态系统(日志基础设施),是实现日志数据的生成、过滤、格式化、分析和长期存储等功能的生态系统。
日志的作用:故障排查、数据分析、安全合规审计、内网安全监控、智能运维。
日志需要告诉运维人员:发生了什么?何时发生的?发生于何处?谁参与其中?参与者来源。
日志使用误区

  1. 不记录日志
  2. 不查看日志
  3. 保留时间过短(至少6个月)
  4. 优先级(等级)
  5. 只收集单一日志
  6. 只搜索已知错误

道:本质是什么?
术:解决问题的方法是什么?
器:工具。

日志采集一般有两种模式:推送和拉取
数据清洗不只是数据修剪,也要增加额外的数据标识
采集数据的时候需要注意个人数据,涉及到隐私数据需要*处理。

日志优先级:
ALL:最低,打开所有日志记录。
TRACE:低日志等级,追踪用。
DEBUG:调试日志用。
INFO:生产环境输出。
WARN:警告,不是错误!
ERROR:错误信息,并不会影响系统继续运行。
FATAL:严重错误,导致系统退出。
OFF:关闭所有日志。

日志存储方式:
一、数据库存储(MySQL)
优点:易用、权限控制和备份恢复、方便部署。
缺点:读写耗时、查询速度有限、删除开销大、存在数据丢失风险。

二、分布式存储(Hadoop)
优点:易扩展、大规模、高吞吐量、容错性、硬件要求低。
缺点:二次开发、访问延时。

三、文件检索系统(Elasticsearch)

倒排序索引,认为是不可变的,所以不用上锁,因而能提升并发能力。
通常包含: DocID文档id、 TF单词频率、 Positing位置、 Offset偏移量。

优点:查找速度快、并发强、节省CPU、IO开销。
缺点:创建索引耗时、维护成本高。

四、云存储
优点:方便存储访问、方便扩容、降低成本、容灾备份。
缺点:读写速度受网络影响、数据安全性不高。

RESTful API
GET:从服务器中取出资源。
POST:在服务器中新建资源。
PUT:在服务器中更新资源(完整的数据)。
PATCH:在服务器中更新资源(需要修改的数据)。
DELETE:从服务器中删除资源。

智能运维:异常检测、根因分析、日志分析、告警收敛、趋势预测。
三西格玛(3sigma):是一种经典的异常检测算法,他通过对历史数据计算均值和方差来判断待检测数据是否在合理范围内。
ARIMA模型:差分整合移动平均回归模型,是一种经典的统计学模型,他通过计算历史数据的一些统计学特征来预测未来数据。
孤立森林算法:基于决策树森林的集成算法,他是无监督算法。先训练出决策树,然后投票是否存在异常。
滑动平均算法:基于数值的简单阀值算法,通过比较滑动窗口内平均值的某种关系(比值、差分等)的历史分布,判断数据是否在合理的范围内波动,是否产生了历史习惯外的波动情况。
GBRT:梯度增强回归树算法是基于增强思想的决策树森林算法,他是有监督算法。增强孤立森林算法,优化改进之前的决策结果。
核密度分析:KDE是一种基于历史数据分布的无监督算法。在时序数据异常检测中,将数据输入模型,得到数据的异常分数。
条件变分自编码器:CVAE是一种涉及神经网络的机器学习算法。在时序数据异常检测中将输入数据窗口化,通过编码器映射为维度更低的隐变量,再由解码器进行复原,如果复原出的数据和原始数据接近程度高,说明输入数据的模式是正常的,反之则是异常。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
1月前
|
存储 分布式计算 监控
【Flume】Flume 监听日志文件案例分析
【4月更文挑战第4天】【Flume】Flume 监听日志文件案例分析
|
4月前
|
监控 Android开发 C语言
深度解读Android崩溃日志案例分析2:tombstone日志
深度解读Android崩溃日志案例分析2:tombstone日志
93 0
|
4月前
|
Go 数据处理 Docker
elk stack部署自动化日志收集分析平台
elk stack部署自动化日志收集分析平台
86 0
|
4月前
|
缓存 固态存储 关系型数据库
MySQL性能优化指南:深入分析重做日志刷新到磁盘的机制
MySQL性能优化指南:深入分析重做日志刷新到磁盘的机制
|
10天前
|
存储 监控 关系型数据库
PHP编写的电脑监控软件:用户登录日志记录与分析
使用PHP编写简单但功能强大的电脑监控软件,记录用户登录日志并进行分析。代码示例展示了如何获取并存储用户IP地址和登录时间到数据库,然后进行登录数据的分析,如计算登录频率和常见登录时间。此外,还介绍了如何通过定时任务自动将监控数据提交到网站,以便实时监控用户活动,提升系统安全性和稳定性。
32 0
|
12天前
|
数据可视化
R语言两阶段最小⼆乘法2SLS回归、工具变量法分析股息收益、股权溢价和surfaces曲面图可视化
R语言两阶段最小⼆乘法2SLS回归、工具变量法分析股息收益、股权溢价和surfaces曲面图可视化
|
17天前
|
机器学习/深度学习 前端开发 数据挖掘
工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断(下)
工具变量法(两阶段最小二乘法2SLS)线性模型分析人均食品消费时间序列数据和回归诊断
223 11
|
5月前
|
存储 监控 安全
带你读《Apache Doris 案例集》——07查询平均提速700% ,奇安信基于 Apache Doris 升级日志安全分析系统(1)
带你读《Apache Doris 案例集》——07查询平均提速700% ,奇安信基于 Apache Doris 升级日志安全分析系统(1)
179 1
|
5月前
|
SQL 存储 安全
带你读《Apache Doris 案例集》——07查询平均提速700% ,奇安信基于 Apache Doris 升级日志安全分析系统(2)
带你读《Apache Doris 案例集》——07查询平均提速700% ,奇安信基于 Apache Doris 升级日志安全分析系统(2)
209 0
|
5月前
|
运维 监控 数据可视化
日志管理:收集和分析Docker容器日志
容器化技术的普及使得应用的部署和管理更加便捷,但随之而来的挑战之一是有效地管理和分析容器产生的大量日志。本文将深入探讨Docker容器日志管理的重要性,介绍常用的日志收集工具,以及如何分析和利用这些日志数据,提供更为丰富和实际的示例代码,帮助大家更好地理解和应用日志管理的关键技术。