数据加工CheatSheet的使用

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 数据加工CheatSheet(速查表)提供了一些简单常见的函数场景,本文主要介绍相关背景以及速查表的使用。

背景介绍

什么是日志服务?

日志服务是针对日志类数据的一站式服,像Log、Metric这类数据我们可以提供大规模、低成本、实时的平台化服务。它的应用场景非常多,像一些监控、分析、诊断都可以通过日志服务去实现,无需开发就能快捷完成日志数据采集、消费、投递以及查询分析等功能,提升运维、运营效率,建立DT时代海量日志处理能力

什么是数据加工?

数据加工是日志服务推出的一项功能,是面向日志进行实时的处理,实时性高且功能丰富。数据加工目前提供了两百多种DSL算子用作数据处理,我们可以在数据加工中根据需求做数据过滤、转换、复制、富化、分裂等操作。


数据加工CheetSheet

简介:

在我们需要做数据加工时 ,虽然有时候很清楚我们需要加工的场景,但可能会出现一个问题:无法准确快速的去选择加工函数查函数文档效率是比较低的,CheetSheet就是为了解决这个问题。

内容:

CheatSheet地址:https://sls.console.aliyun.com/dsl/cheetsheet.pdf
    CheatSheet中目前罗列了一些比较常见的函数和场景,我们可以通过这些去选择我们需要使用的函数,然后根据需求替换参数即可。

部分截图:

场景实例

这里有一个加工场景,可以通过需求场景去选择加工函数。

场景1

CheatSheet选用

1.选用事件处理—>根据条件丢弃日志 + 字段操作->判断字段是否存在

更改参数组合DSL:e_if(e_not_has("error_request"),DROP)

2.选用json解析->提取json中字段的值

更改参数:json_select(v("error_request"), "request_uri")

3.选用字段操作->创建/更新字段值

更改参数组合DSL:e_set("uri", json_select(v("error_request"), "request_uri"))



FAQ

目前CheatSheet中维护的场景和函数比较少,后续会不断完善

根据场景选用了函数,但不知函数的参数以及用法,可在https://help.aliyun.com/document_detail/159702.html函数总览中中查看函数具体用法


相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
7月前
|
存储 SQL 缓存
实时数仓宽表加工解决方案
实时数仓宽表加工解决方案
186 0
实时数仓宽表加工解决方案
|
存储 JavaScript
八字油槽的加工
八字油槽的加工
八字油槽的加工
|
存储 分布式计算 DataWorks
如何正确的做增量加工
回到十多年前,增量加工这个方法并不是一种需要特别需要提出的方法,因为关系数据库的存储与计算性能十分有限(即便是MPP数据库平台也不是全都是做全量加工),增量加工是最普遍的方式。本文讲述了如何在MaxCompute上用与关系数据库的不同的方式做增量数据的加工。
1248 3
如何正确的做增量加工
|
数据采集 编解码 运维
SLS数据加工实现Hashids库对数据进行编码
Hashids是一个非常小巧的跨语言的开源库,它可以将数字编码成一个简短、唯一、非顺序的ID。
240 0
|
数据采集 SQL 分布式计算
数据治理中的数据血缘关系是什么?用来解决什么问题
前言: 数据血缘属于数据治理中的一个概念,是在数据溯源的过程中找到相关数据之间的联系,它是一个逻辑概念。 数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯。大数据数据血缘是指数据产生的链路,直白点说,就是我们这个数据是怎么来的,经过了哪些过程和阶段。
数据治理中的数据血缘关系是什么?用来解决什么问题
|
人工智能
P1233 木棍加工
P1233 木棍加工
109 0
P1233 木棍加工
|
运维 监控 Kubernetes
SLS数据加工2021年技术总结
过去一年,SLS团队持续对数据加工服务进行了各方面迭代升级,本文总结了相关功能与技术上的进展。
990 0
|
存储 JSON 运维
多模式日志数据流的实时加工与集散
日志处理是一个极其繁琐的过程,究其原因是日志的边界情况特别多,而且可能随时在变。阿里云 SLS 数据加工服务是专门针对日志规整、富化、集散等处理场景。本文主要介绍在多模式混杂的日志集散场景下,如何快速使用 SLS 数据加工服务完成需求。
379 0
多模式日志数据流的实时加工与集散