Deepinsight x ChatBI:个人Agent助手养成计划

简介: ✨一文详解Deepinsight x ChatBI个人Agent助手养成计划

 1. 前言

“个人Agent助手养成计划” 可以理解为将个人Agent助手当作新招的一名员工,开始他可能什么也不会,双方也不太了解,而在不断使用的过程中,你慢慢理解怎么使用它,它也更懂你,而最终它会成为你一个很好的助理。它和人一样,需要不断学习,才能解决更多的问题。在这个过程中,我们需要不断对它进行调教。

image.gif

今天这篇文章,我们就看如何把它“打造成你的个人Agent助手”。要用好它就需要知道它的“习性”,如何一步一步养成能够解决实际问题的专业助理。从产品和技术的视角去分析每一个节点所碰到的困难,以及解决方案。

2. 从用户视角一步一步拆解

接下来我们从用户的视角开始对整个使用流程进行一步一步拆解,在使用过程中会遇到哪些阻碍,以及我们的解决方案是什么?

用户在产品上核心会有这几步:


  • 自然语言提问,用户输入自己想问的问题,这里对用户有一个门槛就是什么算一个好的问题。
  • 反问澄清,如果提问模糊,会触发反问,用户补充信息。
  • 结果验证,对于用户来说有一个最大的问题就是这个结果是不是正确,产品层主要提供了三种校验方式:① AI校验;② 产品配置校验;③ 代码校验。
  • 产品操作,如果AI生成的结果错误, 通过产品操作的方式继续任务。

2.1. 如何提出一个好问题

很多人第一个反应一定是:用自然语言提问,这有什么不会的,我不会写代码,我还不会说人话吗?

然而实际情况下,确实提问是用户使用ChatBI碰到的第一个障碍,一般对于模型来说会有几大困惑:

  • 提问模糊,比如:“昨天的数据情况怎么样”,这里对于模型来说“数据”不知道用哪些指标进行表达。“怎么样”不知道是什么意思,什么算好,什么算差没有相对统一的标准。这样的问题模型给出来的答案就不一定尽如人意。一个比较好的问题:“昨天的取数Agent UV数是多少,相比上周同期增长多少”。这个指令就够明确。
  • 提问有歧义,比较常见的是时间选择,一个表里面很有可能有分区日期、创建日期等。那我在这里问“昨天的取数Agent UV数是多少,相比上周同期增长多少”,那模型也不知道这里的“昨天”是指创建日期还是分区日期。解决这个问题的办法一般是用知识进行约束,给这张表维护一个知识:“时间过滤请使用创建时间”,这样大模型就知道如何进行选择了。除了日期还有一些相似的度量都会导致模型出现“选择困难症”。这些问题我们人类解决都是“钉钉”对话进行询问。
  • 不知道怎么问,比如说有些度量用专业术语表达就会有困难,比如说“定义一个留存率的度量”,这里就会涉及到对哪个主体进行分析,以及留存率是周留存还是月留存。
  • 自然语言更麻烦,比较常见的就是计算列,用自然语言描述一个计算列一定杀人的人都有了,这种用产品解决会更简单。

导致当前的现状主要两个原因:① 模型并没有想象的那么强;② 领域知识模型不具备。

解决这个问题,我们首先会在产品中生成一批问题,用户可以在里面进行选择。也可以基于这里的问题,进行相应修改,改成自己想问的一些问题。

image.gif 编辑

2.2. 增加反问澄清,让信息对齐变得更容易

前面提到了,人类的指令往往是模糊的,精准的指令需要额外的思考。比较典型的场景就是我们给老板写总结文字的时候都是“逐字斟酌”,反复看里面有没有歧义和表达不清楚的,原因就是要高效,不然就要反复对话来对齐信息。但是从人类大脑的构造来说,启动慢思考是一见非常耗能的事情,人类更倾向于用短句,不断补充。但是这在AI场景可能就非常灾难。大模型倾向于给出一个答案,而不是质疑你的问题。

为了使模型具备这个能力,我们专门设计了反问指令让模型具备反问的能力,下面就是一个实际案例:


上面这个案例中就会有两个信息大模型不理解:一个是“新版”,一个是“取数Agent”。而这里我们就会模拟人类对话,在对话过程中,如果发现对方说的话有不太理解的地方,进行反问澄清。这个在人类对话中是一个非常常见的对齐信息的方式。

另外,这里对齐信息不是每次都要重复,系统会把这些信息存储在知识库中,下次用户提问的时候,如果在知识库中已经有这条知识,就不会触发反问澄清。这个机制也跟我们人类信息对齐是类似的,我们不需要每次都回到原点对齐信息。也就意味着,当我们不断使用的过程就是不断补齐知识,后续使用就会越来越方便。

Tips:现在的知识只是在这个数据集下生效,如果要维护全局的知识需要去知识中心维护,我们会在11月份的版本解决这个问题。

下面是我们反问澄清的技术方案,核心是识别用户中的一些实体和数据集中的字段、维值和已有的知识进行比对,如果找不到相似的,则触发反问。


2.3. AI生成结果如何验证

前面讲用什么语言的时候讲到大模型一个天然特性就是“幻觉”,人类也有这个问题,人类解决这个问题的方法是通过多路径验证来解决,而这个方式我们用在了对大模型的结论中。


上面这张图就是一个例子,用户可以根据这个结论采取是否使用这个结果。

除了上面有AI的校验之外,用户还可以根据产品配置的方式进行验证。我们会把用户的查询转化成一个图表配置,用户可以根据这个配置判断是否和用户提问的意图保持一致,如果不一致还能基于产品配置继续修改。

image.gif

第三种方式就是直接看代码,最专业的方式肯定是直接看SQL或者DAL,当然也是门槛最高的方式。

image.gif

2.4. 模型生成错误后,用户如何操作

模型生成错误,是一个不可避免的事情,但是用户的任务还要继续,那么如何让用户无缝衔接成为我们优化的方向。解决方案类似于自动驾驶中的L2,在部分场景中,模型可以自运行,但是当碰到无法处理的路况时,智驾会让人类接管车机。而在我们这个场景也是如此。

如果用户发现生成的结果是错误时,那么用户可以通过配置化完成接下来的任务,而不需要再次修改问题提问。


2.4.1. 自然语言结合产品交互的案例


image.gif

上面这个案例里面,度量生成的有点小问题,用户输入来源是“default”,实际上是“DEFAULT”,那么这里最快的方式就是修改这个度量。

第一步:找到度量编辑按钮

image.gif

第二步:修改度量

image.gif

第三步:重新查询

image.gif

这样就可以在自然语言的基础之上,结合产品交互完成用户的需求。

录了一个完整视频,放在下面:


image.gif

2.5. 当然,你也可以直接发起手动查询


这里的设计逻辑在于,保证用户在这里沉浸式完成用户的任务,如果某些任务通过产品交互效率更高,可以直接通过产品交互完成。

3. 总结

显然,大模型要真正解决用户问题,不是那么容易的事情。不在于产品有多绚丽,需要的是大模型和传统的工具进行紧密配合,需要扎实的解决每一个用户节点上的问题,我们相信一步一个脚印前行,一定会让ChatBI解决越来越多的问题。

相关文章
|
1月前
|
自然语言处理 算法 数据可视化
DeepInsight x ChatBI:“智能歧义识别+知识沉淀”,化解模糊查询
本文针对自然语言数据分析中的语义歧义问题,提出“智能澄清-知识沉淀-动态召回”闭环方案,通过精准识别、最少提问、结构化留存用户意图,实现一次澄清、长期复用,显著提升查询效率与体验一致性。
|
3月前
|
SQL 关系型数据库 MySQL
|
16天前
|
存储 缓存 人工智能
图索引性能提升 400%:详解 VSAG 向量检索框架
VSAG 是蚂蚁集团开源的图索引向量检索框架。 本文源自 VSAG 团队在 VLDB'25 发表的《VSAG: An Optimized Search Framework for Graph-based Approximate Nearest Neighbor Search》,介绍 VSAG 框架如何通过缓存优化、自动调参和距离计算加速,在保证高召回率前提下将检索性能提升最高 400%。
|
3月前
|
存储 人工智能 算法
从 VLDB‘25 看向量数据库发展方向:行业观察与技术前瞻
第 51 届国际大型数据库会议(The 51st International Conference on Very Large Data Bases,简称VLDB 2025)是数据管理、数据库系统与大规模数据处理领域最具影响力的国际顶级学术会议之一。本届 VLDB 在于2025 年 9 月 1 日至 9 月 5 日在英国伦敦Queen Elizabeth II Centre (QEII Centre) 举办。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
景区博物馆最新应用:历史IP复活,移动AI数字人互动屏打造文旅爆款体验
世优波塔移动AI数字人互动屏,以高精度建模与AI大模型技术“复活”历史人物,打造可对话、会讲解、能导览的沉浸式文旅体验。通过自然语言交互、智能移动导引与多设备联动,让文物“开口说话”,让文化“活”起来,重新定义博物馆、景区与传统文化的连接方式,开启智慧文旅新纪元。
203 0
|
3月前
|
人工智能 分布式计算 PyTorch
Ray Forward 2025 定档 12 月 20 日北京!议题征集通道已开放
由蚂蚁集团发起的 Ray 中文社区与蚂蚁开源联合主办的 Ray Forward 2025,将于 12 月 20 日在北京蚂蚁 T 空间正式启幕,以 “拥抱 AI,Ray 向未来” 为主题,邀您共探下一代智能计算架构的进化方向。
|
6月前
|
存储 机器学习/深度学习 算法
|
8月前
|
机器学习/深度学习 自然语言处理 数据可视化
⼤模型驱动的DeepInsight Copilot在蚂蚁的技术实践
本文整理自潘兰天(蚂蚁数据智能团队数据分析平台技术专家)在DA数智大会2025·上海站的演讲实录。
|
4月前
|
机器学习/深度学习 人工智能 负载均衡
在 Ray Data 和 Ray Serve 中推出原生 LLM API
https://www.anyscale.com/blog/llm-apis-ray-data-serve 译文