业务观测:从定义到场景化分析

简介: Databuff业务观测功能通过定义业务事件、构建场景模型,实现对关键流程的可视化监控。支持按服务或接口粒度关联请求,创建多事件串联的业务场景,并通过场景地图实时展示各环节状态与指标,助力企业精准识别瓶颈、优化用户体验。

在当今竞争激烈的商业环境中,企业必须实时掌握业务流程的运行状况,以确保高效运营和优化用户体验。Databuff的业务观测功能能够帮助企业直观理解整体业务流程、识别潜在瓶颈、探索优化空间。这不仅提升了流程效率,还能够实时监控业务健康状况、性能表现和用户体验,从而做出更科学的决策。

本文将介绍如何使用Databuff的业务观测功能来界定关键业务事件,构建能够反映真实用户旅程的业务场景模型,进而以更贴合实际操作需求的方式实现高效精准的业务观测。

1. 定义业务事件

1.1 业务事件概述

业务事件是指与特定业务逻辑相关的操作或事件。为了能够以业务视角进行观测,我们需要先对业务事件进行定义,明确其业务含义。例如,将 web应用服务 中的 POST /user/login 请求定义为“登录”业务。

1.2 创建业务事件

创建业务事件时,需要定义以下信息:

业务事件名称:为业务事件命名,例如“用户登录”。
描述:描述业务事件,方便用户对此业务事件进行补充说明。
业务类型:用于区分不同的业务类型。
业务粒度:选择是以服务为业务粒度还是以接口为业务粒度。不同的粒度在选择具体服务或接口请求时有所差异:
服务级粒度:仅能选择具体的服务名称。
接口级粒度:可以依据具体接口拆分业务,在选择接口请求时需先选择服务,再根据服务选择需要关联的接口请求。
关联服务/请求:当业务粒度选中服务级时,显示为“关联服务”,提供服务选择框供用户筛选;当业务粒度选中接口级时,显示为“关联请求”,提供接口请求选择框。选择接口请求时需要先选择请求类型,请求类型有HTTP请求、RPC请求、MQ消费等。

1.3 示例

假设我们有一个 web应用服务,其中包含 POST /user/login 接口。我们可以创建以下业务事件:
image.png

业务事件名称:用户登录
描述:用户通过 POST /user/login 接口进行登录操作。
业务类型:后端业务
业务粒度:接口级
关联请求:POST /user/login

image.png

业务事件名称:获取用户资料
描述:用户通过 GET /user/getUserInfo 和POST /user/findRoleByUserName多个接口获取个人资料。
业务类型:后端业务
业务粒度:接口级
关联请求:GET /user/getUserInfo 和POST /user/findRoleByUserName

2. 创建业务场景

2.1 业务场景概述

业务场景是指由多个业务事件组成的业务流程。通过创建业务场景,可以将各个业务事件串联起来,形成一个完整的业务流程进行分析。

2.2 创建业务场景

创建业务场景时,需要定义以下信息:

业务场景名称:定义业务场景的名称,例如“用户登录流程”。
业务分组:选择一个业务分组。业务分组可以帮助用户管理业务场景,将大量的业务场景梳理在不同业务分组中,方便查看和管理。
关联事件:关联绑定业务事件,根据业务事件的先后顺序串联构成业务场景。

2.3 示例

假设我们有一个“用户登录流程”的业务场景,可以包含以下业务事件:
业务事件名称:用户登录
业务事件名称:获取用户资料创建业务场景时,可以选择“用户登录”、“获取用户信息”和“获取用户菜单”三个业务事件,并按顺序串联。
image.png

3. 管理业务分组

业务分组可以帮助用户对众多业务场景进行分组管理,以增强管理效率。支持自定义业务分组名称,在管理分组页面中,分组的上下顺序决定了在展示时的自上而下顺序。

3.1 示例

假设我们有两个业务分组:“用户管理”和“订单管理”。在“用户管理”分组中,可以包含“用户登录流程”和“用户注册流程”两个业务场景。
image.png
image.png

4. 场景地图

场景地图以可视化的方式展示业务场景中各业务事件的关系以及业务事件的状态和关键指标。在场景地图中,业务场景中的各个业务事件单独判断是否正常,当某个业务事件所对应的对象(服务或接口请求)存在告警时,则业务事件标为红色,表示该业务事件异常。而业务场景中的任意一个业务事件存在异常时,在业务场景看板中对应的业务场景也会标为红色,表示业务场景异常。
image.png
image.png

4.1 关键指标

业务事件会中展示的关键指标有:

请求量:当前业务事件的请求次数。
平均响应时间:当前业务事件的平均响应时间。
错误率:当前业务事件的错误率。

4.2 示例

在“用户下单流程”业务场景中,假设“用户下单”业务事件的请求量为300次,平均响应时间为250毫秒,错误率为0.0%。如果“用户下单”业务事件的某个接口存在告警,则该业务事件在场景地图中会标为红色。右侧也会显示相应的告警数据。
image.png

结论

通过定义业务事件和创建业务场景,我们可以从业务视角全面观测系统的运行状态,及时发现和解决问题。业务分组和场景地图的引入,进一步增强了业务观测的可管理性和可视化程度。

相关文章
|
4月前
|
人工智能 运维 监控
Flink 智能调优:从人工运维到自动化的实践之路
本文由阿里云Flink产品专家黄睿撰写,基于平台实践经验,深入解析流计算作业资源调优难题。针对人工调优效率低、业务波动影响大等挑战,介绍Flink自动调优架构设计,涵盖监控、定时、智能三种模式,并融合混合计费实现成本优化。展望未来AI化方向,推动运维智能化升级。
756 8
Flink 智能调优:从人工运维到自动化的实践之路
|
4月前
|
人工智能 运维 自然语言处理
别再靠“救火”过日子了:智能运维,正在重塑IT服务的未来
别再靠“救火”过日子了:智能运维,正在重塑IT服务的未来
454 15
|
2月前
|
运维 Prometheus 数据可视化
如何一键接入opentelemetry项目,实现可观测分析
本文揭秘如何通过Databuff实现OpenTelemetry的无缝接管,无需改造现有Collector,10分钟完成部署,实现服务与资源间的因果可观测性,呈现云网空间地图,助力运维智能化。
|
3月前
|
存储 运维 监控
云原生NPM与传统NPM的差异
本文对比传统NPM与云原生NPM在部署、流量采集、资源影响等方面的差异,聚焦Packet处理,分析二者优劣。随着eBPF等新技术应用,云原生NPM正加速发展,助力高效网络监控与故障定位。
|
3月前
|
存储 算法 Java
深入理解JVM:内存管理与垃圾回收机制探索
JVM是Java程序的运行核心,实现跨平台、自动内存管理与高效执行。其架构包括类加载、运行时数据区、执行引擎等模块。内存模型历经演变,JDK 8起以元空间替代永久代,优化GC性能。JVM通过分代回收机制,结合标记清除、复制、整理等算法,管理对象生命周期,提升系统稳定性与性能。
|
4月前
|
人工智能 网络协议 NoSQL
在性能优化时,如何避免盲人摸象
盲人摸象最早出自于《大般涅槃经》,讲述一群盲人触摸大象的不同部位,由于每人触及部位不同,却各自认为自己摸到的才是大象的全部,并为此争吵。比喻对事物了解不全面,以偏概全。
505 28
在性能优化时,如何避免盲人摸象
|
4月前
|
SQL 运维 Kubernetes
可观测领域的王者Dynatrace的故障定位体验
本文对比了可观测性领域两大工具Databuff与Dynatrace的故障定位能力。基于17服务的微服务环境测试显示,Databuff在10个案例中准确率达90%,定位更精准、信息更全面;Dynatrace准确率60%,部分场景存在误判或信息缺失,整体表现逊色。
|
7月前
|
SQL
使用sql转换身份证15位-18位
使用sql转换身份证15位-18位
336 1
|
4月前
|
数据采集 人工智能 编解码
AI出码率70%+的背后:高德团队如何实现AI研发效率的量化与优化
本文系统阐述了在AI辅助编程快速发展的背景下,如何构建一套科学、可落地的研发效率量化指标体系
1249 27
AI出码率70%+的背后:高德团队如何实现AI研发效率的量化与优化