惊喜!接入 skywalking 也能直接故障定位了

简介: Databuff推出商业化可观测平台,一键接入SkyWalking数据,通过DataHub管道与因果AI引擎,实现故障秒级定位。本文演示如何将SkyWalking agent数据路由至Databuff,快速构建智能监控体系,提升运维效率。

原文链接:https://databuff.com/resourceDetail/blog106
前言

skywalking 是一款开源的链路工具,经常被开发人员使用。然而其后端功能羸弱、上手门槛高、缺乏商业化支持、代码质量风险大,都成为其难以在客户生产环境大规模部署的原因。

databuff 作为一款商业化的可观测平台工具,为此专门开发了相关特性、用以接管skywalking,能够实现 一键接入skywalking、并直接给出故障定位的结果。你只需把skywalking agent的数据发送地址修改为databuff server。

今天笔者就给大家演示一下接入skywalking的过程与效果,其他方面不做过多阐述:

1)使用 databuff的datahub 模块,一键接入skywalking agent 数据;

2)使用 databuff 因果AI引擎,自动定位demo应用的故障原因;

接下来我们先构建一套测试环境,用以演示上述的功能效果。

01 测试环境说明

Demo环境和操作背景:

91.png

​ 图1:测试环境部署拓扑

测试环境说明:

1)右边部署一套大模型demo应用,主要包含3个组件:LLM service(前端)、MYSQL、LLM;在应用上部署skywalking agent;

2)左边部署一套databuff 平台,平台包含datahub(pipeline)管道、因果AI分析引擎等功能模块;

92.png

​ 图2:测试Demo的应用界面

接下来, 我们按下面的步骤执行:

1.Pipeline创建:在databuff datahub 平台上创建Pipeline;

2.数据路由指定:配置 skywalking agent 文件,将数据接收地址指向 datahub ;

3.制造故障:在测试环境服务器上手动制造故障;

4.故障定位效果验证:在databuff 上查看告警,及故障定位效果;

02 操作演示

2.1 Pipeline 创建

模版一键创建Pipeline

DataHub产品中预定义多种快速接入的模版,直接使用,一键创建,快速对接数据。

93.png

点开创建的Pipeline,复制监听URL

94.png

至此,databuff 平台上接入skywalking的配置完成。

2.2 数据路由指定

配置skywalking 采集大模型应用服务的链路数据和JVM指标数据。

在skywalking Agent config中配置:

collector.backend_service=192.168.50.247:31800

然后直接启动服务,便可轻松接入。

95.png

服务启动命令:

# cd到大模型应用服务目录
cd /home/langchat/langchat-server/target
# java -jar启动大模型服务
java  -javaagent:/home/skywalking-agent/skywalking-agent.jar Dskywalking.agent.service_name=LLM_DEMO -jar langchat-server.jar

2.3 制造故障

在demo应用上,手动停止mysql8(mysql8为容器启动):

[root@host254 target]# docker stop mysql8
mysql8

这里我们手动关闭mysql 之后服务发出异常情况
96.png

2.4 故障定位效果验证

登录databuff平台,查看智能告警内容,并查看请求异常链路

97.png

点击告警详情中的根因分析,查看智能定位原因。

这里可以看出,我们的数据库MySQL实例异常,然后导致的接口调用异常。

98.png

2.5 其他

在完成故障注入与定位演示后,DataBuff 平台还提供了一系列辅助能力,帮助用户进一步理解应用运行状态和系统资源消耗。

2.5.1 查看接收数据

查看应用请求链路和服务JVM指标,调用情况和服务拓扑。

该大模型主要有LLM_DEMO 问答系统,MySQL,还有第三方远程服务
99.png

查看调用远程大模型API链路信息,可以查看大模型应用与远程大模型调用的状态,耗时,以及该服务的一些系统资源指标。

100.png

2.5.2 查看智能告警内容

查看智能告警内容,并可调用链路观测,查看请求异常链路

101.png

2.5.3 查看AI智能分析

如果开启大模型AI配置,根因分析结果后,还会给出推荐处置内容,不但知道哪里有问题,还知道如何进行操作修复。

102.png

本次演示,我们通过DataBuff平台的DataHub,通过深度整合SkyWalking链路数据,为企业提供全栈式智能可观测解决方案。对于很多已经部署了skywalking的客户,他们可以直接把数据路由到databuff平台,即将享受分钟级的应用性故障定位能力。

相关文章
|
2月前
|
算法 定位技术 vr&ar
Rokid手势识别深度测评:从技术原理到开发实战
Rokid通过单摄像头实现高精度手势识别与空间感知,结合AI算法与多模态交互,打造轻量高效的AR解决方案。其UXR SDK提供从底层数据到应用层的完整工具链,助力开发者构建教育、工业、消费等多场景AR应用,推动自然人机交互普及。
312 13
|
2月前
|
运维 算法 数据挖掘
【故障定位系列】基于DeepSeek的故障定位大揭秘
传统故障定位依赖专家经验与固定算法,难以应对复杂场景。引入DeepSeek大模型后,可凭借其强大推理与自适应能力,实现智能故障定位。通过“大模型+Agent”协同架构,大模型负责决策,Agent执行数据分析,既降低Token消耗,又保留智能化分析优势。未来,随着大模型理解与推理能力提升,故障定位将更高效、精准。
|
3月前
|
人工智能 测试技术 开发工具
如何将 AI 代码采纳率从30%提升到80%?
AI编码采纳率低的根本原因在于人类期望其独立完成模糊需求,本文提出了解决之道,讲解如何通过结构化文档和任务拆解提高AI的基础可靠性。
983 24
|
3月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
832 44
|
2月前
|
人工智能 JSON 前端开发
完整项目实战:使用 Playwright MCP 构建网页交互 AI 助手教程
这篇教程完整展示了如何构建一个智能网页操作助手。通过集成Playwright与MCP协议,实现了用自然语言指令驱动浏览器自动化的完整解决方案,涵盖系统架构、核心实现和部署流程,为开发智能网页助手提供了实用指南。
|
2月前
|
存储 人工智能 缓存
运维智能体(SRE Agent)技术分级能力要求
本标准规范了运维智能体在场景应用、协同能力、能力建设及底座构建方面的技术要求,适用于公共与私有环境下的服务与产品。依据AI技术发展,定义了从初始级到优秀级的三级能力框架,涵盖感知、控制、行动等核心能力,推动运维智能化升级。
运维智能体(SRE Agent)技术分级能力要求
|
3月前
|
人工智能 监控 安全
Gartner报告:可观测性平台魔力象限
本文由Gregg Siegfried等作者撰写,阐述了可观测性平台如何通过遥测数据采集、AI分析与成本优化,助力企业提升系统健康度与业务韧性,并详解市场定义、核心功能及主流供应商优劣势。
Gartner报告:可观测性平台魔力象限
|
2月前
|
传感器 监控 供应链
云MES系统源码,支持多终端管理
云MES系统源码,基于SpringBoot + Vue技术栈,支持多端管理,含生产、质检、库存等19大模块,适合中小企业二次开发。实现生产全流程数字化、透明化管理,提升效率与质量,降低运营成本。
160 2
|
2月前
|
数据采集 关系型数据库 MySQL
如何从零开发一款 OneAgent
Databuff自研轻量级OneAgent,专为智能可观测时代打造。具备低资源占用、自动服务发现、SQL查询支持与采集即治理等特性,兼容多语言插件扩展,助力AI-Agent集成与全栈监控统一管理。
|
3月前
|
存储 安全 前端开发
CC&LG实践|基于 LangGraph 一步步实现 Claude-Code 核心设计
本文旨在深入剖析 Claude-Code 的核心设计思想与关键技术实现,逆向分析其功能模块,结合 LangGraph 框架的能力,系统性地演示如何从一个最基础的 ReAct Agent 出发,逐步构建一个功能完备的简版 Claude-Code。
1583 19
CC&LG实践|基于 LangGraph 一步步实现 Claude-Code 核心设计

热门文章

最新文章