Deepinsight x ChatBI:个人Agent助手养成计划

简介: ✨一文详解Deepinsight x ChatBI个人Agent助手养成计划

 1. 前言

这里我为什么取名为“个人Agent助手养成计划”,可以理解为个人Agent助手相当于你新招的一个员工,开始他可能什么也不会,双方也不太了解,而在不断使用的过程中,你慢慢理解怎么使用它,它也更懂你,而最终它会成为你一个很好的助理。它和人一样,需要不断学习,才能解决更多的问题。在这个过程中,我们需要不断对它进行调教。

image.gif

今天这篇文章,我们就看如何把它“打造成你的个人Agent助手”。要用好它就需要知道它的“习性”,如何一步一步养成能够解决实际问题的专业助理。从产品和技术的视角去分析每一个节点所碰到的困难,以及解决方案。

2. 从用户视角一步一步拆解

接下来我们从用户的视角开始对整个使用流程进行一步一步拆解,在使用过程中会遇到哪些阻碍,以及我们的解决方案是什么?

用户在产品上核心会有这几步:


  • 自然语言提问,用户输入自己想问的问题,这里对用户有一个门槛就是什么算一个好的问题。
  • 反问澄清,如果提问模糊,会触发反问,用户补充信息。
  • 结果验证,对于用户来说有一个最大的问题就是这个结果是不是正确,产品层主要提供了三种校验方式:① AI校验;② 产品配置校验;③ 代码校验。
  • 产品操作,如果AI生成的结果错误, 通过产品操作的方式继续任务。

2.1. 如何提出一个好问题

很多人第一个反应一定是:用自然语言提问,这有什么不会的,我不会写代码,我还不会说人话吗?

然而实际情况下,确实提问是用户使用ChatBI碰到的第一个障碍,一般对于模型来说会有几大困惑:

  • 提问模糊,比如:“昨天的数据情况怎么样”,这里对于模型来说“数据”不知道用哪些指标进行表达。“怎么样”不知道是什么意思,什么算好,什么算差没有相对统一的标准。这样的问题模型给出来的答案就不一定尽如人意。一个比较好的问题:“昨天的取数Agent UV数是多少,相比上周同期增长多少”。这个指令就够明确。
  • 提问有歧义,比较常见的是时间选择,一个表里面很有可能有分区日期、创建日期等。那我在这里问“昨天的取数Agent UV数是多少,相比上周同期增长多少”,那模型也不知道这里的“昨天”是指创建日期还是分区日期。解决这个问题的办法一般是用知识进行约束,给这张表维护一个知识:“时间过滤请使用创建时间”,这样大模型就知道如何进行选择了。除了日期还有一些相似的度量都会导致模型出现“选择困难症”。这些问题我们人类解决都是“钉钉”对话进行询问。
  • 不知道怎么问,比如说有些度量用专业术语表达就会有困难,比如说“定义一个留存率的度量”,这里就会涉及到对哪个主体进行分析,以及留存率是周留存还是月留存。
  • 自然语言更麻烦,比较常见的就是计算列,用自然语言描述一个计算列一定杀人的人都有了,这种用产品解决会更简单。

导致当前的现状主要两个原因:① 模型并没有想象的那么强;② 领域知识模型不具备。

解决这个问题,我们首先会在产品中生成一批问题,用户可以在里面进行选择。也可以基于这里的问题,进行相应修改,改成自己想问的一些问题。

image.gif 编辑

2.2. 增加反问澄清,让信息对齐变得更容易

前面提到了,人类的指令往往是模糊的,精准的指令需要额外的思考。比较典型的场景就是我们给老板写总结文字的时候都是“逐字斟酌”,反复看里面有没有歧义和表达不清楚的,原因就是要高效,不然就要反复对话来对齐信息。但是从人类大脑的构造来说,启动慢思考是一见非常耗能的事情,人类更倾向于用短句,不断补充。但是这在AI场景可能就非常灾难。大模型倾向于给出一个答案,而不是质疑你的问题。

为了使模型具备这个能力,我们专门设计了反问指令让模型具备反问的能力,下面就是一个实际案例:


上面这个案例中就会有两个信息大模型不理解:一个是“新版”,一个是“取数Agent”。而这里我们就会模拟人类对话,在对话过程中,如果发现对方说的话有不太理解的地方,进行反问澄清。这个在人类对话中是一个非常常见的对齐信息的方式。

另外,这里对齐信息不是每次都要重复,系统会把这些信息存储在知识库中,下次用户提问的时候,如果在知识库中已经有这条知识,就不会触发反问澄清。这个机制也跟我们人类信息对齐是类似的,我们不需要每次都回到原点对齐信息。也就意味着,当我们不断使用的过程就是不断补齐知识,后续使用就会越来越方便。

Tips:现在的知识只是在这个数据集下生效,如果要维护全局的知识需要去知识中心维护,我们会在11月份的版本解决这个问题。

下面是我们反问澄清的技术方案,核心是识别用户中的一些实体和数据集中的字段、维值和已有的知识进行比对,如果找不到相似的,则触发反问。


2.3. AI生成结果如何验证

前面讲用什么语言的时候讲到大模型一个天然特性就是“幻觉”,人类也有这个问题,人类解决这个问题的方法是通过多路径验证来解决,而这个方式我们用在了对大模型的结论中。


上面这张图就是一个例子,用户可以根据这个结论采取是否使用这个结果。

除了上面有AI的校验之外,用户还可以根据产品配置的方式进行验证。我们会把用户的查询转化成一个图表配置,用户可以根据这个配置判断是否和用户提问的意图保持一致,如果不一致还能基于产品配置继续修改。

image.gif

第三种方式就是直接看代码,最专业的方式肯定是直接看SQL或者DAL,当然也是门槛最高的方式。

image.gif

2.4. 模型生成错误后,用户如何操作

模型生成错误,是一个不可避免的事情,但是用户的任务还要继续,那么如何让用户无缝衔接成为我们优化的方向。解决方案类似于自动驾驶中的L2,在部分场景中,模型可以自运行,但是当碰到无法处理的路况时,智驾会让人类接管车机。而在我们这个场景也是如此。

如果用户发现生成的结果是错误时,那么用户可以通过配置化完成接下来的任务,而不需要再次修改问题提问。


2.4.1. 自然语言结合产品交互的案例


image.gif

上面这个案例里面,度量生成的有点小问题,用户输入来源是“default”,实际上是“DEFAULT”,那么这里最快的方式就是修改这个度量。

第一步:找到度量编辑按钮

image.gif

第二步:修改度量

image.gif

第三步:重新查询

image.gif

这样就可以在自然语言的基础之上,结合产品交互完成用户的需求。

录了一个完整视频,放在下面:


image.gif

2.5. 当然,你也可以直接发起手动查询


这里的设计逻辑在于,保证用户在这里沉浸式完成用户的任务,如果某些任务通过产品交互效率更高,可以直接通过产品交互完成。

3. 总结

显然,大模型要真正解决用户问题,不是那么容易的事情。不在于产品有多绚丽,需要的是大模型和传统的工具进行紧密配合,需要扎实的解决每一个用户节点上的问题,我们相信一步一个脚印前行,一定会让ChatBI解决越来越多的问题。

相关文章
|
3天前
|
云安全 人工智能 自然语言处理
|
7天前
|
人工智能 Java API
Java 正式进入 Agentic AI 时代:Spring AI Alibaba 1.1 发布背后的技术演进
Spring AI Alibaba 1.1 正式发布,提供极简方式构建企业级AI智能体。基于ReactAgent核心,支持多智能体协作、上下文工程与生产级管控,助力开发者快速打造可靠、可扩展的智能应用。
754 17
|
11天前
|
数据采集 人工智能 自然语言处理
Meta SAM3开源:让图像分割,听懂你的话
Meta发布并开源SAM 3,首个支持文本或视觉提示的统一图像视频分割模型,可精准分割“红色条纹伞”等开放词汇概念,覆盖400万独特概念,性能达人类水平75%–80%,推动视觉分割新突破。
783 59
Meta SAM3开源:让图像分割,听懂你的话
|
1天前
|
人工智能 安全 小程序
阿里云无影云电脑是什么?最新收费价格个人版、企业版和商业版无影云电脑收费价格
阿里云无影云电脑是运行在云端的虚拟电脑,分企业版和个人版。企业版适用于办公、设计等场景,4核8G配置低至199元/年;个人版适合游戏、娱乐,黄金款14元/月起。支持多端接入,灵活按需使用。
231 164
|
8天前
|
搜索推荐 编译器 Linux
一个可用于企业开发及通用跨平台的Makefile文件
一款适用于企业级开发的通用跨平台Makefile,支持C/C++混合编译、多目标输出(可执行文件、静态/动态库)、Release/Debug版本管理。配置简洁,仅需修改带`MF_CONFIGURE_`前缀的变量,支持脚本化配置与子Makefile管理,具备完善日志、错误提示和跨平台兼容性,附详细文档与示例,便于学习与集成。
330 116
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
Z-Image:冲击体验上限的下一代图像生成模型
通义实验室推出全新文生图模型Z-Image,以6B参数实现“快、稳、轻、准”突破。Turbo版本仅需8步亚秒级生成,支持16GB显存设备,中英双语理解与文字渲染尤为出色,真实感和美学表现媲美国际顶尖模型,被誉为“最值得关注的开源生图模型之一”。
298 3
|
5天前
|
弹性计算 搜索推荐 应用服务中间件
阿里云服务器租用价格:一年、1小时及一个月收费标准及优惠活动参考
阿里云服务器优惠汇总:轻量应用服务器200M带宽38元/年起,ECS云服务器2核2G 99元/年、2核4G 199元/年,4核16G 89元/月,8核32G 160元/月,香港轻量服务器25元/月起,支持按小时计费,新老用户同享,续费同价,限时秒杀低至1折。
399 166

热门文章

最新文章