站在 2025 年的节点回望企业AI实践,真正的竞争优势并不在于模型本身,而在于那些他人难以获取或理解的数据。下一个十年,谁能掌控数据,谁就能定义未来生产力。
基于上千条真实用户问题反馈,历经数月深度调研与精心打磨,瓴羊重磅发布《2025数据分析Agent白皮书:AI重构数据消费》。白皮书内容聚焦数据分析Agent的技术路线、落地方案与未来方向,希望能将团队多年积累的思考传递给所有关心数据领域技术和应用发展的用户。
完整白皮书下载链接:https://survey.lydaas.com/apps/zhiliao/UZVBI4JVO?cl=aly
内容价值
2023年,LLM突破自然语言理解瓶颈,使对话取数成为可能,问答BI(ChatBI)成为业界普遍方向;2025年,Agent技术的发展赋予了AI系统自主规划、执行、反思的能力,数据分析Agent也成长为能够理解业务需求、自主处理数据、生成专业洞察的企业级智能助手。
源于技术浪潮的推动、企业分析的需求、数据产品突破的探索,这些种种因素,让AI对数据分析的重构成为了一种必然。
数据分析Agent、ChatBI、NL2SQL、Data Agent等诸多的技术词汇及新兴概念让人目不暇接。而涉及到多源、动态且庞大的复杂数据以及专业化、领域化的技术实践,即使是数据产品经理或者AI产品经理,也很难对当前AI数据分析领域的技术与产品发展做出深度解读与判断。
- 什么是NL2SQL、NL2DSL、NL2Code?非技术人员如何快速理解这些技术路线的优劣势?
- ChatBI、Data Agent、数据分析Agent是一个东西吗?
- 数据分析Agent在技术上做了什么创新?和把数据传到通义千问里分析相比,有什么本质上的差异?
- 当前市场呈现出什么样的竞争格局?整体来看又有哪些发展趋势?
- 走在前面的企业做了哪些关键动作让数据分析Agent落地?什么样的项目团队更容易获得好的结果?
- 领域内普遍面临的问题是什么?而解决这些数据准确性和数据知识化等等问题的方向又是什么?
- ......
从不同技术路线的优劣对比、相关产品概念的能力区分,到落地实操的关键思路,诸多困惑让用户如同雾里看花,难辨方向。在本篇白皮书中,我们尝试用简洁易懂的语言概括相关知识,解读当前数据分析Agent技术架构、落地路径与未来方向,希望能帮助众多关心数据领域的用户解答以上问题,拨开认知迷雾,理解产品本质。
这是瓴羊Quick BI团队历经数月打磨的诚意之作,也是多年深耕数据分析领域的实践沉淀。白皮书的结尾写道:“我们正在经历AI重塑产业变革的时代,也在亲手创造新一代数据产品。”我们希望能将过程中新的认知与思考传递给用户,也欢迎阅读白皮书后有所思考的用户们与我们共同展开深度交流与碰撞。
目录及精华节选
2 技术解构 节选
相较于 NL2SQL直接转化为通用 SQL语句,NL2DSL先将自然语言转化为适配各BI产品的特定领域语言,更具备数据分析领域的场景适配性,能够最大化复用成熟的BI技术体系,相对来说会具备较高的准确性、时效性、安全性。但正因如此,NL2DSL路线需要依赖BI技术体系,同时需要通过训练的方式让大模型具备对DSL语言的理解,所以NL2DSL路线一方面对团队的技术要求比较高,另一方面查询的复杂性会受限于BI引擎的能力边界。
......
在实践过程中,为了达到更好的数据准确性、场景覆盖度以及用户体验,有技术资源的团队,会在以下两方面进一步优化:一方面,采用混合路线,比如加入NL2Code/NL2Python而非单纯依赖NL2DSL路线;另一方面,混合采用Plan-and-Act及ReAct进行规划,基于分析问题和场景选择合适的模式。以Quick BI的QueryAgent为例,支持开启规划模式,可对歧义性问题进行澄清、发散性问题进行任务编排、收敛性问题自主判断哪些能力范围内的任务、超纲类问题进行拒识,同时也支持混合特定场景的算法小模型调用。所以在国际数据技术领域中,逐步将这样的技术路线统一定义为NL2Data路线。
6 未来展望 节选
数据准度是一切可能性的前提......我们认为,解决准确性问题的落点依旧在于综合性的方案,比如选择合适的模型甚至进行专项模型训练、建立高质量的基础数据集、构建完备的数据语义及知识库。
在分析深度方面,数据知识化是必然趋势。数据知识化包含两个方面,首先是将结构化的数据通过理解解读为非结构化的知识,在此基础上观测趋势、识别异常、洞见原因进而形成有效行动策略的知识。我们不能仅仅寄希望于大模型对更大量级数据的理解力提升,而是需要在面向AI的数据预计算与拆解、适时选择小模型对结构化数据深加工、高质量非结构化数据构建这三方面采取行动并积累实践经验。具体来说,以下这些方面值得我们关注:
- 如何连接企业高频数据,让数据更好更高效地转化为知识
- 如何构建行业分析模型,内化企业知识,快速构建多种分析场景Agent
- 如何提升洞察归因能力,围绕业务场景降低使用门槛,围绕核心指标实现沙盘推演
- 如何覆盖多种报告场景,从非结构化数据中萃取高质量知识
完整白皮书下载链接:https://survey.lydaas.com/apps/zhiliao/UZVBI4JVO?cl=aly