半天掌握日志存储 云启实验室系列课程 第三讲 | 日志服务之数据清洗与入湖

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
阿里云盘企业版 CDE,企业版用户数5人 500GB空间
简介: 半天掌握日志存储 云启实验室系列课程 第三讲 | 日志服务之数据清洗与入湖本教程介绍如何使用日志服务接入 NGINX 模拟数据,通过数据加工对数据进行清洗并归档至OSS中进行存储专家支持:阿里云日志服务技术专家 王星宇 唐恺
 

好运集市 春天好运会发芽🌱

半天掌握日志存储,云启实验室系等你来!

好运集市.jpeg

4月21日-4月29日,完成以下课程学习即可参与抽奖,100%中奖,云小宝、双肩包、VR眼镜等你来。
点击实验室课程链接:https://developer.aliyun.com/adc/series/activity/sls-1

课程实践.png

半天掌握日志存储 云启实验室系列课程 第三讲 | 日志服务之数据清洗与入湖 实验背景

本场景将提供日志服务 SLS Project 和对象存储 OSS。通过本教程的操作,您可以使用日志服务接入 NGINX 模拟数据,通过数据加工对数据进行清洗并归档至 OSS 中进行存储。

本场景主要涉及以下云产品和服务:
• 日志服务(SLS)
日志服务SLS是云原生观测与分析平台,为Log、Metric、Trace等数据提供大规模、低成本、实时的平台化服务。日志服务一站式提供数据采集、加工、查询与分析、可视化、告警、消费与投递等功能,全面提升您在研发、运维、运营、安全等场景的数字化能力。
• 对象存储OSS
阿里云对象存储服务(Object Storage Service,简称OSS)是阿里云提供的海量、安全、低成本、高可靠的云存储服务。其数据设计持久性不低于99.999999999%,服务设计可用性不低于99.99%。具有与平台无关的RESTful。

实验后您将收获到:
• 接入NGINX模拟数据。
• 通过数据加工对数据进行清洗。
• 归档至OSS中进行长期冷存。

半天掌握日志存储 云启实验室系列课程 第三讲 | 日志服务之数据清洗与入湖 实验手册

接入NGINX模拟数据

本步骤将指导您如何使用日志服务接入 NGINX 模拟数据。

  1. 双击打开虚拟桌面的Firefox ESR浏览器
  2. 在RAM用户登录框中单击下一步,并复制粘贴页面左上角的子用户密码用户密码输入框,单击登录
  3. 复制下方地址,在Firefox ESR浏览器打开新页签,粘贴并访问日志服务控制台。
https://sls.console.aliyun.com/
  1. 日志服务控制台下方的Project列表中,选择Project资源所在地域,然后单击Project名称。

说明 :您可以在云产品资源列表中查看Project资源所在地域和Project名称。

img

  1. 在日志存储页面左侧,单击日志库下的img 图标。

img

  1. 创建Logstore对话框中,输入Logstore名称,打开WebTracking开关,然后单击确定

参数说明:

  • Logstore名称:输入target。
  • WebTracking:打开WebTracking开关,您可以通过WebTracking从HTML、H5、iOS或Android上采集数据到日志服务。

img

  1. 创建成功对话框中,单击取消

img

  1. 在日志存储页面左侧,选择日志库>target>数据接入>模拟接入,然后单击img 图标。

img

  1. 快速接入面板中,单击NGINX访问日志下的模拟

img

  1. 模拟接入页面,单击开始导入

img

  1. 模拟接入页面,等待大约一分钟,模拟数据生成后,单击开始使用

img

返回如下页面,您可以看到生成的NGINX模拟数据。

img

创建数据加工

本步骤将指导您如何创建数据加工,将status字段不为200的请求日志存储到目标库中,并查看目标库日志。

  1. 在日志存储页面左侧,单击日志库下的img 图标。

img

  1. 创建Logstore对话框中,输入Logstore名称,打开WebTracking开关,然后单击确定

说明 :该Logstore用来status字段不为200的请求日志。

参数说明:

  • Logstore名称:输入target-1。
  • WebTracking:打开WebTracking开关,您可以通过WebTracking从HTML、H5、iOS或Android上采集数据到日志服务。

img

  1. 创建成功对话框中,单击取消

img

  1. 在日志存储页面左侧,单击target-1

img

  1. 错误对话框中,单击确定

img

  1. target-1页签右上方,单击开启索引

img

  1. 查询分析面板中,打开全文索引,单击确定

img

  1. 查询分析设置对话框中,单击确认

img

  1. target-1页签左侧,单击target

img

  1. target页签,单击数据加工

img

  1. target数据加工页签,输入如下加工语句,单击保存数据加工
e_drop(e_search("status:200"))

img

  1. 创建数据加工规则面板,输入规则名称,单击添加,然后配置存储目标,时间范围选择为某时间,单击确定

参数说明:

  • 规则名称:自定义规则名称,例如nginx-data-cleaning。
  • 目标名称:存储目标的名称,输入target-1。
  • 目标Region:选择您的Project资源所在地域。
  • 目标Project:选择您的Project名称。
  • 目标库:选择target-1。
  • 时间范围:选择某时间开始。

img

img

  1. 创建结果对话框中,单击确认

img

  1. target页签左侧,单击target-1

img

  1. target-1页签右上方,单击查询/分析

img

返回如下页面,您可以看到在目标库target-1中的日志,只有status字段非200的日志。

img

日志投递

本步骤将指导您如何将数据加工后的日志投递到对象存储OSS。

  1. target-1页签页面左侧,选择日志库>target-1>数据处理>导出>OSS(对象存储)

img

  1. OSS投递管理页签,单击开启投递

img

  1. 投递提示对话框中,单击直接投递

img

  1. OSS投递功能对话框中,参考如下配置,其他配置保持默认即可,单击确定

参数说明:

  • OSS投递名称:自定义OSS投递名称,例如test。
  • OSS Bucket:输入Bucket Name。您可以在云产品资源列表中查看到Bucket Name。

img

  1. 投递提示对话框中,单击确认

img

  1. OSS投递管理器页签,稍等三分钟并刷新页面,您可以看到如下图页面,表示您已成功将数据加工后的日志投递到对象存储OSS。

img

  1. 复制下方地址,在Firefox ESR浏览器打开新页签,粘贴并访问对象存储OSS控制台。
https://oss.console.aliyun.com/overview
  1. 在左侧导航栏中,单击Bucket列表

img

  1. Bucket列表页面,找到您的Bucket名称,单击Bucket名称

img

返回如下页面,您可以看到您的Bucket中有一个文件夹,文件夹中就存储着数据加工后的日志。

img

img

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
12天前
|
存储 SQL 专有云
支持配置审计日志的存储数据库
审计日志作为企业监管平台的重要依据,同时也是“等保三级”认证的必要考察项之一。Dataphin V4.3版本支持设置平台日志的存储数据源,帮助用户快速获取审计日志,同时介绍了不同部署模式的Dataphin如何查看审计日志的方法。
|
23天前
|
Java
日志框架log4j打印异常堆栈信息携带traceId,方便接口异常排查
日常项目运行日志,异常栈打印是不带traceId,导致排查问题查找异常栈很麻烦。
|
1月前
|
存储 监控 数据可视化
SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
【9月更文挑战第2天】SLS 虽然不是直接使用 OSS 作为底层存储,但它凭借自身独特的存储架构和功能,为用户提供了一种专业、高效的日志服务解决方案。
66 9
|
1月前
|
存储 分布式计算 资源调度
通过日志聚合将作业日志存储在HDFS中
如何通过配置Hadoop的日志聚合功能,将作业日志存储在HDFS中以实现长期保留,并详细说明了相关配置参数和访问日志的方法。
20 0
通过日志聚合将作业日志存储在HDFS中
|
2月前
|
API C# 开发框架
WPF与Web服务集成大揭秘:手把手教你调用RESTful API,客户端与服务器端优劣对比全解析!
【8月更文挑战第31天】在现代软件开发中,WPF 和 Web 服务各具特色。WPF 以其出色的界面展示能力受到欢迎,而 Web 服务则凭借跨平台和易维护性在互联网应用中占有一席之地。本文探讨了 WPF 如何通过 HttpClient 类调用 RESTful API,并展示了基于 ASP.NET Core 的 Web 服务如何实现同样的功能。通过对比分析,揭示了两者各自的优缺点:WPF 客户端直接处理数据,减轻服务器负担,但需处理网络异常;Web 服务则能利用服务器端功能如缓存和权限验证,但可能增加服务器负载。希望本文能帮助开发者根据具体需求选择合适的技术方案。
68 0
|
2月前
|
C# Windows 监控
WPF应用跨界成长秘籍:深度揭秘如何与Windows服务完美交互,扩展功能无界限!
【8月更文挑战第31天】WPF(Windows Presentation Foundation)是 .NET 框架下的图形界面技术,具有丰富的界面设计和灵活的客户端功能。在某些场景下,WPF 应用需与 Windows 服务交互以实现后台任务处理、系统监控等功能。本文探讨了两者交互的方法,并通过示例代码展示了如何扩展 WPF 应用的功能。首先介绍了 Windows 服务的基础知识,然后阐述了创建 Windows 服务、设计通信接口及 WPF 客户端调用服务的具体步骤。通过合理的交互设计,WPF 应用可获得更强的后台处理能力和系统级操作权限,提升应用的整体性能。
69 0
|
2月前
|
存储 消息中间件 监控
Java日志详解:日志级别,优先级、配置文件、常见日志管理系统ELK、日志收集分析
Java日志详解:日志级别,优先级、配置文件、常见日志管理系统、日志收集分析。日志级别从小到大的关系(优先级从低到高): ALL < TRACE < DEBUG < INFO < WARN < ERROR < FATAL < OFF 低级别的会输出高级别的信息,高级别的不会输出低级别的信息
|
2月前
|
存储
【Azure Log A workspace】Azure上很多应用日志收集到Log A workspace后如何来分别各自的占比呢?
【Azure Log A workspace】Azure上很多应用日志收集到Log A workspace后如何来分别各自的占比呢?
|
2月前
|
API
【Azure 应用服务】当在Azure App Service的门户上 Log Stream 日志无输出,需要如何操作让其输出Application Logs呢?
【Azure 应用服务】当在Azure App Service的门户上 Log Stream 日志无输出,需要如何操作让其输出Application Logs呢?
|
SQL 数据采集 监控
基于日志服务数据加工分析Java异常日志
采集并脱敏了整个5月份的项目异常日志,准备使用日志服务数据加工做数据清洗以及分析。本案例是基于使用阿里云相关产品(OSS,RDS,SLS等)的SDK展开自身业务。需要对异常日志做解析,将原始日志中时间、错误码、错误信息、状态码、产品信息、请求方法、出错行号提取出来。然后根据提取出来的不同产品信息做多目标分发处理。对清洗后的数据做异常日志数据分析。
788 0
基于日志服务数据加工分析Java异常日志

相关产品

  • 日志服务
  • 下一篇
    无影云桌面