日志实时分析:从入门到精通

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,内容安全 1000次 1年
阿里云盘企业版 CDE,企业版用户数5人 500GB空间
简介: 做业务的人,常常需要面临以下问题: 产品的受欢迎程度怎么样?该重点投入到哪个功能中? 各个营销渠道的流量怎么样? 该向哪个渠道投入更多资源? + 各个阶段的转化率、留存率有多少?有哪些瓶颈点需要优化? 如果没有数据,就只能够靠瞎猜,靠经验来判断。

日志实时分析:从入门到精通

为什么要实时分析日志

做业务的人,常常需要面临以下问题:

  • 产品的受欢迎程度怎么样?该重点投入到哪个功能中?
  • 各个营销渠道的流量怎么样? 该向哪个渠道投入更多资源?
  • 各个阶段的转化率、留存率有多少?有哪些瓶颈点需要优化?

如果没有数据,就只能够靠瞎猜,靠经验来判断。一旦业务方向走偏,一方面自己的业务量受影响,另一方面,耽误时间,给竞争对手以可乘之机。

日志是程序记录事件和状态的数据。通过日志数据的采集、存储和分析,我们可以很好地掌控产品的质量,辅助我们对开发、运营、运维等活动作出更加及时、更加精确的决策。在业务上,时间就是金钱,能够快速的实时分析出结果,能够及时的帮我们发现业务上的问题,节省我们的时间,帮助我们把业务能力提升不止一个量级。

那么,我们如何选择日志分析的架构呢?

日志分析:架构选型

在日志分析领域,用户可以选择开源的ELK方案,也可以选择阿里云日志服务。这篇文档在功能、价格方面对ELK、日志服务做了全方位对比,仅供参考。

image.png

一般选择技术架构的思路,我们从需求出发,再到落地成本呢,包括运维成本、财务成本,最终选择一个能够满足需求的最低成本的解决方案。具体到日志分析上,我们从这几点出发考虑:

image.png

  • 功能的丰富程度,是否支持

    • 关键字查询
    • 聚合计算,表达式的丰富程度
    • grouping 计算
    • 多维数据join
  • 性能和规模

    • 数据写入吞吐量能达到多少?TB?PB?
    • 数据计算一次计算能覆盖多大数据量?
  • 实时性

    • 从数据产生,到计算出结果,需要多久?秒级别?是实时的?还是离线的?
    • 实时性和规模是不可调和的。
  • 数据的重要程度

    • 是每天运营的报表?一天算一次?还是要立刻拿到结果?

image.png

日志服务的分析提供哪些能力

日志服务分析语法,提供标准的SQL语法,可以同时使用sls的查询和SQL计算功能。

在API上,支持:

  • 日志服务API
  • JDBC,可对接任意开源JDBC协议客户端。

在功能上:

  • 支持20+类别的函数,共150+函数,覆盖了常用的计算、统计、转换、安全审计功能。
  • 支持可视化展示,可以实时的交互式查询,动态展示结果。

在性能上:

  • 支持TB级别的计算能力。
  • 秒级别内获取结果。

在生态上:

  • 日志服务控制台,提供dashboard,提供线图、饼图、流图等多种类型的视图,对接文档
  • 通过grafana插件连接日志服务,通过grafana可视化展示日志计算结果,对接文档
  • 无缝打通datav,通过datav大屏,展示日志的计算结果,对接文档

开始试用Demo

若你没有账号,可以点击此处试用demo,查看分析功能,或者查看配置的各种仪表盘。

入门之路

日志服务是完全serverless的服务。只需要完成初次的对接,安装好客户端,配置好要采集哪些日志,日志接入参考文档

之后即可在控制台完成分析功能。

image.png

开始使用日志分析之路:

  1. 打开日志服务控制台
  2. 选择对应的project
    image.png
  3. 点击查询,进入查询页面
    i    mage.png
  4. 如果没有开启索引,请打开索引,如果没有没有创建列索引,则无法执行SQL,请在右上角查询分析属性,创建对应的列索引
    image.pngimage.png
  5. 在红框中输入查询条件
    image.png
  6. 查询出结果后,添加到仪表盘
    image.png
  7. 打开仪表盘,查看保存的查询结果
    image.png

进阶之路

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
16天前
|
缓存 监控 算法
分析慢日志文件来优化 PHP 脚本的性能
分析慢日志文件来优化 PHP 脚本的性能
08-06-06>pe_xscan 精简log分析代码 速度提升一倍
08-06-06>pe_xscan 精简log分析代码 速度提升一倍
|
2月前
|
SQL 监控 关系型数据库
使用 pt-query-digest 工具分析 MySQL 慢日志
【8月更文挑战第5天】使用 pt-query-digest 工具分析 MySQL 慢日志
40 3
使用 pt-query-digest 工具分析 MySQL 慢日志
|
2月前
|
存储 分布式计算 大数据
【Flume的大数据之旅】探索Flume如何成为大数据分析的得力助手,从日志收集到实时处理一网打尽!
【8月更文挑战第24天】Apache Flume是一款高效可靠的数据收集系统,专为Hadoop环境设计。它能在数据产生端与分析/存储端间搭建桥梁,适用于日志收集、数据集成、实时处理及数据备份等多种场景。通过监控不同来源的日志文件并将数据标准化后传输至Hadoop等平台,Flume支持了性能监控、数据分析等多种需求。此外,它还能与Apache Storm或Flink等实时处理框架集成,实现数据的即时分析。下面展示了一个简单的Flume配置示例,说明如何将日志数据导入HDFS进行存储。总之,Flume凭借其灵活性和强大的集成能力,在大数据处理流程中占据了重要地位。
37 3
|
2月前
|
应用服务中间件 Linux nginx
在Linux中,如何统计ip访问情况?分析 nginx 访问日志?如何找出访问页面数量在前十位的ip?
在Linux中,如何统计ip访问情况?分析 nginx 访问日志?如何找出访问页面数量在前十位的ip?
|
2月前
|
Java Shell Linux
【Linux入门技巧】新员工必看:用Shell脚本轻松解析应用服务日志
关于如何使用Shell脚本来解析Linux系统中的应用服务日志,提供了脚本实现的详细步骤和技巧,以及一些Shell编程的技能扩展。
31 0
【Linux入门技巧】新员工必看:用Shell脚本轻松解析应用服务日志
|
2月前
|
监控 安全 关系型数据库
在Linux中,什么是系统日志和应用程序日志?如何分析它们?
在Linux中,什么是系统日志和应用程序日志?如何分析它们?
|
2月前
|
XML Java Maven
Spring5入门到实战------16、Spring5新功能 --整合日志框架(Log4j2)
这篇文章是Spring5框架的入门到实战教程,介绍了Spring5的新功能——整合日志框架Log4j2,包括Spring5对日志框架的通用封装、如何在项目中引入Log4j2、编写Log4j2的XML配置文件,并通过测试类展示了如何使用Log4j2进行日志记录。
Spring5入门到实战------16、Spring5新功能 --整合日志框架(Log4j2)
|
2月前
|
存储 消息中间件 监控
Java日志详解:日志级别,优先级、配置文件、常见日志管理系统ELK、日志收集分析
Java日志详解:日志级别,优先级、配置文件、常见日志管理系统、日志收集分析。日志级别从小到大的关系(优先级从低到高): ALL < TRACE < DEBUG < INFO < WARN < ERROR < FATAL < OFF 低级别的会输出高级别的信息,高级别的不会输出低级别的信息
|
2月前
|
算法 关系型数据库 程序员
第一周算法设计与分析:A : log2(N)
这篇文章介绍了解决算法问题"输入一个数N,输出log2N(向下取整)"的三种编程思路,包括使用对数函数和幂函数的转换方法,以及避免浮点数精度问题的整数逼近方法。

相关产品

  • 日志服务
  • 下一篇
    无影云桌面