日志服务(SLS)数据模拟器初体验

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 日志服务SLS是阿里集团自研的一站式日志平台,用户无需开发就能能够开箱即用地使用它来提升运维、运营效率,建立 DT 时代海量日志处理能力。SLS数据模拟器是SLS提供的一个用于接入模拟数据的数据接入方式,支持丰富的数据模拟场景,包含各类阿里云云产品日志、自建开源/商业软件日志以及Metric日志等,助力用户一键式导入模拟数据。

日志服务(SLS)数据模拟器初体验

一、背景

日志服务SLS(https://help.aliyun.com/document_detail/48869.html)是阿里集团自研的一站式日志平台,它包含数据实时采集、数据加工、智能查询分析以及数据分发四大基础功能,用户无需开发就能能够开箱即用地使用它来提升运维、运营效率,建立 DT 时代海量日志处理能力。
image.png

日志服务SLS支持从40+渠道采集日志数据,涵盖客户端、网页、协议、SDK、API等多种日志采集方式(https://help.aliyun.com/document_detail/28981.html),为用户提供了强大的数据采集能力。然而在一些测试或Demo场景下,用户无法接入日志数据,或者SLS提供的数据采集方式会显得代价过高。试想如下三种场景:

场景一:用户想体验SLS对OSS(阿里云对象存储服务)访问日志的查询分析和可视化能力,但是不想开通OSS服务。
场景二:用户想在SLS中接入主机监控日志来体验SLS的时序存储与分析能力,但是真实场景的数据由于敏感性原因无法接入。
场景三:用户想持续往SLS的日志库中接入Nginx访问日志,以用于测试SLS的数据加工功能,但是没有真实的Nginx日志用于持续采集。通过代码持续模拟Nginx访问日志,并通过SDK的方式写入的方式对于用户来说较为繁琐。

在以上三种场景下,用户想要使用SLS的日志查询分析、可视化以及数据加工等功能,却苦于无法接入测试日志数据。为了解决以上场景的数据接入痛点,SLS推出数据模拟器,助力用户更简单、快速地接入贴近真实场景模拟数据。

二、数据模拟器简介

SLS数据模拟器是SLS提供的一个专用于接入模拟数据的数据接入方式,用户可以利用数据模拟器在自己的Logstore中生成并接入模拟数据。

目前SLS数据模拟器支持21种不同的数据模拟场景,包含各类阿里云云产品日志(SLB七层日志、OSS访问日志等)、自建开源/商业软件日志(Nginx访问日志等)以及Metric日志(主机监控日志等)。除了生成不同场景的模拟数据之外,SLS数据模拟器还会每个数据场景配套生成一些内置报表,用于可视化展示生成的模拟数据。

SLS数据模拟器具体支持的数据场景以及对应的内置报表如下:

阿里云云产品日志

日志场景名称 所属云产品 内置报表
SLB七层日志 负载均衡 SLB SLB操作日志、SLB访问日志
RDS审计日志 云数据库RDS RDS审计中心、RDS审计安全中心、RDS审计性能中心
WAF日志 Web应用防火墙 WAF安全中心、WAF运营中心、WAF访问中心
VPC流日志 专有网络VPC VPC流日志概览
云防火墙日志 云防火墙 云防火墙统计中心
DRDS日志 云原生分布式数据库 DRDS日志性能中心、DRDS日志运营中心、DRDS日志安全中心
NAS访问日志 文件存储NAS NAS运营中心、NAS文件系统操作统计中心、NAS文件系统明细信息
CDN日志 CDN CDN错误分析、CDN基础数据、CDN热门资源、CDN用户分析
DDoS日志 DDos防护 DDoS访问中心、DDoS运营中心
API网关日志 API网关 API网关访问统计中心
函数计算消费日志 函数计算
Redis审计日志 云数据库Redis版 Redis审计中心
OSS访问日志 对象存储OSS OSS运维中心、OSS性能中心、OSS访问中心、OSS审计中心
OSS计量日志 对象存储OSS
SAS主机进程日志 云安全中心 主机日志-进程中心
SAS主机登录日志 云安全中心 主机日志-登录中心
SAS主机网络日志 云安全中心 主机日志-网络中心
Kubernetes-Ingress日志 容器服务Kubernetes版 Ingress异常检测中心、Ingress监控中心、Ingress访问中心、Ingress蓝绿发布监控、Ingress概览

自建开源/商业软件日志

日志场景名称 内置报表
Nginx访问日志 Nginx访问日志中心
Tomcat访问日志 Tomcat访问日志中心

Metirc日志 (时序)

日志场景名称 内置报表
主机监控日志 主机监控中心

三、开始使用数据模拟器

1. 使用入口

用户目前可以通过两种方式使用数据模拟器。第一种方式是在日志服务控制台首页的【接入数据】功能区中,选择【模拟接入】的接入方式(图1)。
image.png

图1 控制台首页【接入数据】功能区选择【模拟接入】

可通过点击查看更多数据源查看所有支持的模拟数据场景(图2)。
image.png

图2 目前支持的所有模拟数据场景

第二种方式是进入项目(Project)后,在Logstore的功能菜单上,点击数据接入->模拟接入侧边的“+”按钮(图3)

image.png

图3 Logstore功能菜单中的【模拟接入】功能

随后会弹出模拟接入的窗口,展示目前支持的所有模拟数据场景。image.png

图4 点击【模拟接入】后展示所有支持的模拟数据场景

用户选择一个需要模拟的数据场景,点击【模拟】后(图5),便会进入模拟数据的配置流程。用户配置完成后,数据模拟器会根据用户的配置生成相应数据场景的模拟数据。image.png

图5 点击【模拟】开始模拟数据

2. 数据模拟器配置流程

2.1 选择模拟数据场景

以SLB七层日志为例,在日志服务控制台首页【接入数据】功能区中,选择模拟数据类的接入方式后,找到【SLB七层日志】,并点击【模拟】(参考图6)**。image.png

图6 选择SLB七层日志进行模拟

2.2 选择存储模拟数据的项目和日志库

在选择完数据场景并点击【模拟】后,根据提示选择相应的项目(Project)和日志库(Logstore),用于存储生成的模拟数据(参考图7)。如果没有现成的项目和日志库,用户也可以在这一步创建相应的项目和Logstore。如果是在Project内部的Logstore功能菜单上点击的【模拟接入】,则会自动跳过此步骤。image.png

图7 选择或创建Project和Logstore

注:如果点击【正常接入】,则会引导用户使用SLS提供的数据采集或接入方式,接入对应场景的真实数据,而非模拟场景。

2.3 配置模拟任务

选择完存储模拟数据的Project和Logstore后,点击下一步,进入模拟任务的配置界面。配置界面包含两部分内容:【范围频率】配置与【日志字段】配置(图8)。
image.png


图8 模拟任务配置界面

在【范围频率】配置的标签页中可配置如下内容:

配置项 说明
时间范围 指定模拟数据生成的起始时间与结束时间。如果不指定结束时间,会持续生成模拟数据。
分布模型 生成模拟数据的数据量分布模型,包括随机、周期与线性,用户可以自定义分布模型的相关参数。以周期分布为例,用户可以自定义变化周期、最小值、最大值和抖动值。
- 变化周期:数据量分布变化周期,支持秒、分钟、小时、天和周。
- 最小值:每秒最小数据量。
- 最大值:每秒最大数据量。
- 抖动值:例如设置抖动为0.1,模型数据量为count,则最终的数据量在[0.9count, 1.1count]之间随机。
异常点 分布模型中所确定的数据量的基础上,随机选择某些时间点,在这些时间点上,数据量会出现异常变化,用户可以指定出现异常点的概率和异常点数据量变化的倍率。用户可以配置多个异常选项。


在【日志字段】配置的标签页中定义了字段名称、字段数据类型、字段随机参数和字段值等信息,用户可以根据需求,调整字段随机参数和字段值(图9)。
image.png

图9 配置日志字段

配置完范围频率与日志字段的信息后,点击【开始导入】,便会在Logstore中建立数据模拟任务并生成模拟数据(相应的日志索引也会自动创建),此过程大约需要一分钟左右的时间(图10)。
image.png

图10 创建模拟任务并生成模拟数据

上述过程完成后,点击【开始使用】,便可在Logstore中查询到对应的模拟日志数据(图11)。image.png

图11 查看生成的模拟日志

3. 模拟数据的查询分析与可视化

在模拟数据生成之后,用户可以对模拟日志进行查询分析并创建对应的可视化图表仪表盘。SLS数据模拟器除了生成模拟数据之外,还为每个模拟数据场景配备了一些内置报表,从不同维度对模拟数据进行可视化地展示。在模拟数据导入进Logstore后,会自动创建这两个仪表盘,来可视化地展示模拟日志的分析与统计情况。

对于云产品日志,以SLB七层日志为例,该模拟场景提供了【SLB访问日志】(图12)和【SLB操作日志】(图13)两个可视化仪表盘,可视化地展示了SLB的访问和操作统计。

图12 SLB七层日志内置仪表盘——SLB访问日志中心


image.png

图13 SLB七层日志内置仪表盘——SLB操作日志中心

对于自建/开源商业软件日志,以Nginx访问日志为例,该模拟场景提供了【Nginx访问日志】(图14)这个可视化仪表盘,可视化地展示了Nginx访问各项指标的统计情况。!

图14 Nginx访问日志内置仪表盘——Nginx访问日志中心

对于Metric(时序)日志,以主机监控为例,该模拟场景提供了【主机监控(图15)这个可视化仪表盘,可视化地展示了主机各项指标的统计情况。image.png

图15 主机监控内置仪表盘——主机监控中心

4. 模拟数据的其他使用场景

除了对模拟日志进行查询分析与可视化外,用户还可以在自己的Logstore中,基于生成的模拟日志,使用SLS的全链路功能,如:

1)基于模拟日志创建告警
2)使用SLS数据加工功能对模拟日志进行规整、富化、分发、汇总、重建索引等加工操作;
3)使用SLS数据投递功能将模拟日志实时投递至OSS、MaxCompute等阿里云产品中,对接数据仓库;
4)使用SLS提供的日志消费功能对模拟日志进行实时消费,用于流计算、实时计算或对接开源生态(Flink,Blink,Spark Streaming...)等;
5)...(更多功能参考日志服务官方文档

四、结语

在很多测试或Demo场景下,模拟数据的接入是一个经常会遇到的痛点。SLS数据模拟器为用户提供了便捷的模拟数据接入方式,使用户能一键式生成贴近真实场景的模拟数据到SLS日志库中。用户可以利用SLS数据模拟器将20+场景的模拟数据接入到自己的Logstore中,进而使用SLS的全链路功能(查询分析、可视化、告警、数据加工...)。更进一步地,用户还可以使用SLS数据投递功能将模拟数据输出到其他数据仓库中,抑或是使用SLS日志消费功能,将模拟数据用于流计算、实时计算等,对接开源生态。

SLS数据模拟器将在未来提供更丰富的数据模拟场景的支持,如果您也有一些数据场景并且希望在SLS数据模拟器中集成这些场景,欢迎联系我们!

  • 知乎专栏:aliyunlog
  • 微信公众号:日志服务
  • 邮箱:lc224725@alibaba-inc.com

image.png

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
1月前
|
XML 安全 Java
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
本文介绍了Java日志框架的基本概念和使用方法,重点讨论了SLF4J、Log4j、Logback和Log4j2之间的关系及其性能对比。SLF4J作为一个日志抽象层,允许开发者使用统一的日志接口,而Log4j、Logback和Log4j2则是具体的日志实现框架。Log4j2在性能上优于Logback,推荐在新项目中使用。文章还详细说明了如何在Spring Boot项目中配置Log4j2和Logback,以及如何使用Lombok简化日志记录。最后,提供了一些日志配置的最佳实践,包括滚动日志、统一日志格式和提高日志性能的方法。
359 30
【日志框架整合】Slf4j、Log4j、Log4j2、Logback配置模板
|
15天前
|
监控 安全 Apache
什么是Apache日志?为什么Apache日志分析很重要?
Apache是全球广泛使用的Web服务器软件,支持超过30%的活跃网站。它通过接收和处理HTTP请求,与后端服务器通信,返回响应并记录日志,确保网页请求的快速准确处理。Apache日志分为访问日志和错误日志,对提升用户体验、保障安全及优化性能至关重要。EventLog Analyzer等工具可有效管理和分析这些日志,增强Web服务的安全性和可靠性。
|
2月前
|
XML JSON Java
Logback 与 log4j2 性能对比:谁才是日志框架的性能王者?
【10月更文挑战第5天】在Java开发中,日志框架是不可或缺的工具,它们帮助我们记录系统运行时的信息、警告和错误,对于开发人员来说至关重要。在众多日志框架中,Logback和log4j2以其卓越的性能和丰富的功能脱颖而出,成为开发者们的首选。本文将深入探讨Logback与log4j2在性能方面的对比,通过详细的分析和实例,帮助大家理解两者之间的性能差异,以便在实际项目中做出更明智的选择。
335 3
|
1月前
|
存储 Oracle 关系型数据库
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
本文介绍了MySQL InnoDB存储引擎中的数据文件和重做日志文件。数据文件包括`.ibd`和`ibdata`文件,用于存放InnoDB数据和索引。重做日志文件(redo log)确保数据的可靠性和事务的持久性,其大小和路径可由相关参数配置。文章还提供了视频讲解和示例代码。
152 11
【赵渝强老师】MySQL InnoDB的数据文件与重做日志文件
|
25天前
|
存储 监控 安全
什么是事件日志管理系统?事件日志管理系统有哪些用处?
事件日志管理系统是IT安全的重要工具,用于集中收集、分析和解释来自组织IT基础设施各组件的事件日志,如防火墙、路由器、交换机等,帮助提升网络安全、实现主动威胁检测和促进合规性。系统支持多种日志类型,包括Windows事件日志、Syslog日志和应用程序日志,通过实时监测、告警及可视化分析,为企业提供强大的安全保障。然而,实施过程中也面临数据量大、日志管理和分析复杂等挑战。EventLog Analyzer作为一款高效工具,不仅提供实时监测与告警、可视化分析和报告功能,还支持多种合规性报告,帮助企业克服挑战,提升网络安全水平。
|
2月前
|
存储 缓存 关系型数据库
MySQL事务日志-Redo Log工作原理分析
事务的隔离性和原子性分别通过锁和事务日志实现,而持久性则依赖于事务日志中的`Redo Log`。在MySQL中,`Redo Log`确保已提交事务的数据能持久保存,即使系统崩溃也能通过重做日志恢复数据。其工作原理是记录数据在内存中的更改,待事务提交时写入磁盘。此外,`Redo Log`采用简单的物理日志格式和高效的顺序IO,确保快速提交。通过不同的落盘策略,可在性能和安全性之间做出权衡。
1712 14
|
1月前
|
存储 监控 安全
什么是日志管理,如何进行日志管理?
日志管理是对IT系统生成的日志数据进行收集、存储、分析和处理的实践,对维护系统健康、确保安全及获取运营智能至关重要。本文介绍了日志管理的基本概念、常见挑战、工具的主要功能及选择解决方案的方法,强调了定义管理目标、日志收集与分析、警报和报告、持续改进等关键步骤,以及如何应对数据量大、安全问题、警报疲劳等挑战,最终实现日志数据的有效管理和利用。
112 0
|
1月前
|
SQL Oracle 关系型数据库
【赵渝强老师】Oracle的联机重做日志文件与数据写入过程
在Oracle数据库中,联机重做日志文件记录了数据库的变化,用于实例恢复。每个数据库有多组联机重做日志,每组建议至少有两个成员。通过SQL语句可查看日志文件信息。视频讲解和示意图进一步解释了这一过程。
|
2月前
|
数据采集 机器学习/深度学习 存储
使用 Python 清洗日志数据
使用 Python 清洗日志数据
49 2
|
2月前
|
Python
log日志学习
【10月更文挑战第9天】 python处理log打印模块log的使用和介绍
44 0

相关产品

  • 日志服务