日志数据预处理与投递

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 在我们做数据投递的时候,可能需要先对数据做一定的加工处理,像数据字段的保留、删除、改名,打包等操作,加工完成之后然后我们再投递到相应的服务中。

背景介绍

什么是日志服务?

日志服务是针对日志类数据的一站式服,像Log、Metric这类数据我们可以提供大规模、低成本、实时的平台化服务。它的应用场景非常多,像一些监控、分析、诊断都可以通过日志服务去实现,无需开发就能快捷完成日志数据采集、消费、投递以及查询分析等功能,提升运维、运营效率,建立DT时代海量日志处理能力

什么是数据加工?

数据加工是日志服务推出的一项功能,是面向日志进行实时的处理,实时性高且功能丰富。数据加工目前提供了两百多种DSL算子用作数据处理,我们可以在数据加工中根据需求做数据过滤、转换、复制、富化、分裂等操作。

什么是数据投递?

数据投递是指将日志服务采集的数据投递至OSS、ADB、MaxCompute等其他阿里云产品中,便于您长期存储数据或联合其它系统消费数据。

数据加工与投递

在我们做数据投递的时候,可能需要先对数据做一定的加工处理,像数据字段的保留、删除、改名,打包等操作,加工完成之后然后我们再投递到相应的服务中。

场景实例

这里有一个场景,在数据投递之前我们需要对左边的原始日志做一些加工处理,右边的日志是我们投递需要的日志,图中包含了三个加工场景。

场景使用字段操作函数解决示范

场景1:字段重命名操作

场景2:字段删除操作



场景3:字段打包操作


字段操作函数介绍


FAQ

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
4月前
|
存储 分布式计算 监控
日志数据投递到MaxCompute最佳实践
日志服务采集到日志后,有时需要将日志投递至MaxCompute的表中进行存储与分析。本文主要向用户介绍将数据投递到MaxCompute完整流程,方便用户快速实现数据投递至MaxCompute。
199 2
|
分布式计算
33 MAPREDUCE的 web日志预处理
33 MAPREDUCE的 web日志预处理
58 0
|
6月前
|
数据采集 监控 网络协议
使用函数计算(FC)通过Syslog协议投递日志
本文主要介绍一种使用函数计算(FC)通过Syslog协议投递日志的方法。
157 0
使用函数计算(FC)通过Syslog协议投递日志
|
SQL 分布式计算 监控
阿里云EMR自定义日志投递与使用实践分享
EMR目前支持了日志管理,即日志客户SLS投递的功能,基于此功能,客户可以将需要的各种大数据组件日志收集到自身SLS中,做查询和分析。基于此功能,客户可以自定义日志路径、规则,对集群设备上的日志自行接收和消费。本文以采集指标文件为例,帮助您快速上手自定义日志投递与使用。
427 1
阿里云EMR自定义日志投递与使用实践分享
|
6月前
|
弹性计算 监控 网络协议
使用ECS通过Syslog协议投递日志到SIEM
Syslog是一个常见的日志通道,几乎所有的SIEM(例如IBM Qradar, HP Arcsight)都支持通过Syslog渠道接收日志。本文主要介绍如何通过Syslog将日志服务中的日志投递到SIEM。
145 0
使用ECS通过Syslog协议投递日志到SIEM
|
6月前
|
存储 运维 监控
运维编排最佳实践:将运维编排任务执行记录投递到OSS/SLS
运维编排服务(Operation Orchestration Service),简称OOS,是全面、免费的云上自动化运维平台,提供运维任务的管理和执行。典型使用场景包括:事件驱动运维,批量操作运维,定时运维任务,跨地域运维等,OOS为重要运维场景提供审批,通知等功能。OOS帮您实现标准化运维任务,从...
运维编排最佳实践:将运维编排任务执行记录投递到OSS/SLS
|
6月前
|
存储 分布式计算 监控
操作审计最佳实践:将阿里云操作日志持续投递到您的 SLS/OSS
操作审计(ActionTrail)帮助您监控并记录阿里云账号的活动,包括通过阿里云控制台、OpenAPI、开发者工具对云上产品和服务的访问和使用行为,记录为操作日志。 操作审计支持所有阿里云账号的免开通服务,默认为所有账号记录并存储近 90 天的日志。但在实际应用中,受法律法规和企业审计标准的要求,...
394 0
|
存储 SQL 数据采集
日志数据投递到MaxCompute最佳实践
日志服务采集到日志后,有时需要将日志投递至MaxCompute的表中进行存储与分析。本文主要向用户介绍将数据投递到MaxCompute完整流程,方便用户快速实现数据投递至MaxCompute。
|
数据采集 资源调度 监控
网站流量日志分析--工作流调度--预处理调度--功能实现 | 学习笔记
快速学习网站流量日志分析--工作流调度--预处理调度--功能实现
网站流量日志分析--工作流调度--预处理调度--功能实现 | 学习笔记
|
数据采集 分布式计算 监控
网站流量日志分析--工作流调度--预处理调度--程序打包 job 编写 | 学习笔记
快速学习网站流量日志分析--工作流调度--预处理调度--程序打包 job 编写
网站流量日志分析--工作流调度--预处理调度--程序打包 job 编写 | 学习笔记