AI时代如何让大模型「读懂」企业数据?——从“单一问数”到“复杂决策”的智能跃迁

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 从早期的传统BI,到敏捷BI,再到智能BI,BI工具正逐步进化为具备类人推理能力的数字助手。Gartner预测,到2025年,增强型消费者体验将首次推动增强型BI(ABI)能力的采用率超过50%,这将深刻重塑企业的业务流程与决策模式,“人人都是数据消费者”的时代正加速到来。

近期在QCon全球软件开发大会上,阿里云智能集团瓴羊高级技术专家王璟尧以「从数据到决策:AI驱动的Quick BI架构设计与实践」为主题,系统阐述了大模型如何从底层架构到用户体验,全面推动Quick BI从「数据执行」迈向「智能决策」,深入解析了Quick BI在自研领域模型与通用大模型协同融合下,构建AI与BI深度集成的技术路径,为智能BI的发展提供了实践范式。

01

技术范式跃迁:

从「取数工具」到「决策智能体」

“所有产品都值得用大模型重做一遍,BI产品也不例外。”

王璟尧认为,大模型打通了自然语言与数据语言之间的鸿沟,催生出智能搭建(Copilot)、智能问数(ChatBI)、洞察分析(Insight)、决策智能(Decision Intelligence)等多种能力形态。从数据连接到分析决策,BI的每一个环节都具备被大模型重塑的可能。而要打造真正意义上的企业级智能BI,关键在于构建“通用大模型 + 企业私域数据 + BI工具”三位一体的技术架构,实现认知智能与业务理解的深度融合。

image.png

*大模型驱动的业务落地方向

在实践中,瓴羊基于成熟的大模型平台,训练出专注BI领域的专属模型,并结合全面的产品能力,构建出AI与BI深度融合的最佳路径。

在智能搭建方面,Quick BI 通过微调NL2API指令识别系统,将大模型作为自然语言与前端API之间的“中介”,用户输入指令即可完成高频、复杂的交互操作。

在洞察分析方面,Quick BI 通过内置算法、大模型解读与外部Agent接入的完善,助力用户深入理解数据趋势、识别指标异动,并追溯背后的业务逻辑,实现从“看见数据”到“看懂数据”的跨越。

在智能问数方面,Quick BI 则实现了轻量模型与通用大模型的灵活协同:基础问答由小模型快速响应,关键节点则引入大模型深度推理,确保语义理解准确、问数体验自然,让“问数据”真正变得如与人对话般自然、高效。

“我们对大模型的态度是开放的,会同时使用通用模型和领域模型,将他们放置到最合适的位置上。”

王璟尧表示,瓴羊通用大模型与自研领域模型的混合流程设计,可以“让模型能知道怎么跟BI系统打交道”,“让BI系统能读懂模型的返回”,同时借助强大的产品能力基座,让AI与BI“双剑合璧”,释放数据真正的价值。

image.png

*通用大模型与自研领域模型的混合流程设计

为了实现更强的数据分析与交互能力,Quick BI还聚焦BI Agent,依据任务规划->工具选择->工具使用->任务拆解后的递归执行->最终反馈生成的逻辑,探索更多数据智能场景的扩展与落地。

image.png

*BI+Agent:更多BI领域的工具

02

工程架构设计:

如何让大模型听懂企业数据语言?

作为 Quick BI 在大模型驱动下的智能化落地产品集合,智能小Q确定了企业级、开放性、多场景、拓展性四大标准,融合了建模、分析、加速、渲染四大核心引擎,分层构建起从底层 BI 引擎基座、自研领域模型层,到 AI 中间层与应用层的完整架构体系,为智能BI的规模化部署与复杂场景适配奠定了坚实基础。

“架构设计上,Quick BI 实现了从 NL2DSL 到 NL2SQL2DSL,再到混合模型的逐步演进,可谓是吸收各个路线的优势。”

王璟尧指出,即使用户问出相对复杂的问题,智能小Q也可以经过模型的复杂链路处理,发给查询引擎进行取数,确保语义理解的专业性与稳定性。这一工程链路解决了传统NL2SQL面临的关键问题,保障了问数功能的可用性、可信度与交互性。

03

算法黑箱破局:

拆解复杂任务,让智能更安全可控

大模型驱动的数据分析不是一锤定音的“黑盒”,而是可规划、可拆解、可干预的“任务链”。在最重点的NL2SQL算法领域,Quick BI 面临挑战主要集中在以下三个方面:1)自然语言的模糊性,需要进行精确化映射;2)语言的结构化,需要结构和逻辑整体正确;3)用户输入信息的不完整性,需要结合隐藏信息进行补充。

image.png

*NL2SQL算法的挑战

为应对这些挑战,瓴羊Quick BI在模型训练前对目标效果进行了明确定义与系统化预演,从源头构建“好助手”的能力画像。

“理想的数据分析助手不仅要具备‘有效’、‘准确’的风格,还应具备一气呵成处理复杂任务的能力。”

在王璟尧看来,在大模型层面必须拥有高度稳定的基础表现、专业贴合的分析思维,以及良好的任务规划与自我矫正能力,确保用户在可理解、可参与的流程中实现高质量的数据洞察与决策支持。

这一从“问数”到“答策”的智能跃迁,关键在于领域大模型的深度训练。只有为模型输入足够多维、足够准确的信息——包括任务描述、表字段信息、企业知识库、历史样例等,才能使其生成符合 Quick BI 风格的抽象 SQL 代码,让自然语言真正成为高效的数据分析工具,推动智能 BI 从执行工具走向决策智能体。

image.png

*一个问数问题的大模型旅程

然而,随着问数场景日益复杂、用户意图愈加多元,基于DSL语义的训练样本构建成本不断攀升。为此,Quick BI 推出了基于 BI 引擎的 NL2SQL 算法,借助丰富的算子函数、可组合的多步计算逻辑、灵活的增强SQL语法以及高质量样本数据,构建起稳定可控的语义转化机制,极大降低了训练与推理门槛。

“我们并非直接认知世界,而是通过语言结构去理解它。”

现场,王璟尧还引用了维特根斯坦的观点所言,认为大模型只有构建起一套清晰、简洁、稳定的“分析语言”,模型才能有效认知数据逻辑、输出精准指令,基于BI引擎的NL2SQL算法满足了这一需求,“它既能巧妙利用通用模型的能力,又能大大降低训练样本的准备成本,串联起复杂查询意图到取数流程”,真正让智能 BI 具备「听得懂、答得准、推得深」的关键能力。

04

场景价值爆发:

多智能体协同的BI未来

当前,大模型驱动的 Quick BI 已在快消、零售、饮品等多个行业实现落地突破,智能能力逐步走向业务一线。

“智能小Q可以在SaaS版本上自助购买和开通,几乎零门槛使用,同时也支持私有化部署和交付。”

据王璟尧介绍,在某饮品行业客户的实践中,Quick BI 通过模型能力强化与指标体系扩展,将问数准确率从 65% 提升至 92%,验证了其在真实业务场景下的智能分析与精准决策能力。

随着 AI 与 BI 的深度协同不断推进,诸如数据现状感知、问题诊断归因、方案知识调用等原本割裂的能力,正在大模型的统筹下实现有机整合、智能联动。

当 BI 不再只是查询与报表的工具,而成为真正可理解业务、可指导行动的「数据智能体」,瓴羊Quick BI 正在通过技术架构的重构与产品能力的延展,推动智能 BI 向更高阶形态演进。最终,将“人人都是数据消费者”的愿景,转化为企业数字化转型的现实生产力。

目录
打赏
0
0
1
0
13
分享
相关文章
开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告
开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告
58 2
开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告
什么是AI智能体?与大模型有何区别?为何在当下爆发?
AI智能体是具备自主理解、规划与执行能力的智能系统,不再局限于被动回答问题,而是能主动调用工具、感知环境、完成复杂任务。它标志着AI从“对话”走向“行动”的重大突破,或将引领一场效率革命。
云上AI推理平台全掌握 (5):大模型异步推理服务
针对大模型推理服务中“高计算量、长时延”场景下同步推理的弊端,阿里云人工智能平台 PAI 推出了一套基于独立的队列服务异步推理框架,解决了异步推理的负载均衡、实例异常时任务重分配等问题,确保请求不丢失、实例不过载。
构建时序感知的智能RAG系统:让AI自动处理动态数据并实时更新知识库
本文系统构建了一个基于时序管理的智能体架构,旨在应对动态知识库(如财务报告、技术文档)在问答任务中的演进与不确定性。通过六层设计(语义分块、原子事实提取、实体解析、时序失效处理、知识图构建、优化知识库),实现了从原始文档到结构化、时间感知知识库的转化。该架构支持RAG和多智能体系统,提升了推理逻辑性与准确性,并通过LangGraph实现自动化工作流,强化了对持续更新信息的处理能力。
66 3
让AI读懂代码需求:模块化大模型微调助力高效代码理解与迁移
本文介绍了一种解决开源项目代码升级中“用户需求关联相应代码”难题的创新方法。面对传统Code RAG和Code Agent在召回率、准确率和稳定性上的不足,以及领域“黑话”和代码风格差异带来的挑战,作者团队提出并实践了一套以大模型微调(SFT)为核心的解决方案。
132 13
AI Agent多模态融合策略研究与实证应用
本文从多模态信息融合的理论基础出发,构建了一个结合图像与文本的AI Agent模型,并通过PyTorch代码实现了完整的图文问答流程。未来,多模态智能体将在医疗、自动驾驶、虚拟助手等领域展现巨大潜力。模型优化的核心是提升不同模态的协同理解与推理能力,从而打造真正“理解世界”的AI Agent。
AI Agent多模态融合策略研究与实证应用
FastRead——AI驱动的智能读写生产力引擎,重构信息处理与内容创作新范式
FastRead是一款智能内容处理工具,基于大模型技术,自动解析网页、文档、音频等多源内容,提取关键信息并生成多模态知识卡片。它重构信息处理流程,提升内容创作效率,适用于新闻、金融、教育、营销等多个场景,助力用户高效获取与输出知识。
FastRead——AI驱动的智能读写生产力引擎,重构信息处理与内容创作新范式
NekroAgent - 一体式跨平台多人AI智能聊天机器人框架
NekroAgent 是一个基于 AI 的智能聊天机器人框架,起源于 QQBot 插件,现发展为独立、功能强大的平台。它支持多平台适配、代码生成与安全沙盒执行、可视化管理界面,并具备高度扩展性与多模态交互能力,适用于 Linux、Windows、MacOS 系统部署。
103 0
NekroAgent - 一体式跨平台多人AI智能聊天机器人框架
阿里开源即封神,一上线就斩获4000+ star背后的真相,WebAgent多步骤智能网搜神器,颠覆你对AI的信息检索印象!
WebAgent 是阿里巴巴开源的多步骤智能网搜神器,包含 WebWalker、WebDancer、WebSailor 等模块,支持复杂推理与长上下文信息检索,GitHub 已获 4.7k star,颠覆传统 AI 搜索方式。
AI助理
登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问

你好,我是AI助理

可以解答问题、推荐解决方案等