B端Agent的机会,不在于“助手”,而在基于垂直领域的任务式Agent微调

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
简介: 该文讨论了AI助手在企业服务中的应用,指出通用的“助手”Agent(如Coze、钉钉)在B端业务场景中表现一般,因为它们依赖用户正确指导且易发散。相比之下,任务式Agent(如TFlow)针对特定行业和场景进行微调,能更好地理解和执行复杂任务,具有更高准确性和稳定性,适合企业业务流程。TFlow的优势包括场景微调、优化流程处理,开发和使用成本较低,能直接解决实际业务问题。作者认为,B端Agent的机会在于为企业降低成本或增加效益,而任务式Agent通过微调形成的适配性成为其核心竞争力。

Coze、钉钉的Ai助理吸引了无数眼球,但是角色扮演的助理Agent落地一直很一般。同时“助理”型服务无法满足B端的实际业务场景,因为在B端工作中,特别是在客服场景下,十分强调回复准确性、稳定性,以及按照要求来执行具体的任务,解决实际业务问题。而相比助理Agent,通过对Agent框架的微调,在客服领域的表现完全强于coze、钉钉,更能落地在企业业务流程中。

“助手”Agent模式特点

“助手”Agent是设计用来执行广泛的基础任务,不特定于任何特定行业或复杂场景场景。它们通常处理简单的查询、日常信息查询、基本的客户互动问答。更多是为个人提供灵感,快速查找信息,总结文档等,他依赖于“使用者”下达合适的指令以及正确的引导,才能达到合适的效果。

如图中Coze的Agent创建,提示词中标注为技能、各种插件工具。他依赖于大模型的智能水平,在用户提问的时候,进行发散,决定要使用的“技能”,问什么答什么。

“任务式”Agent模式点

垂直领域的任务Agent是专门为特定行业或业务场景的问题,更强调落地,为用户解决具体的场景问题(用户不需要懂Ai,自需要使用即可),能够处理更理解复杂或特定的任务。它们通常需要Agent对业务场景有深入了解,并能够适配。自动处理用户意图下的问题,并切能准确有效的解答,不会发散。

如图为“TFLow Agent”(框架微调的Agent)产品截图。提示词为任务流程的描述、要求。他给到模型思考逻辑、执行逻辑、限制模型的发散。让模型的每一步执行都在规定的范围内,从而能够更好的代理确定的性的信息,以及稳定的流程。他能落地的具体的业务中,解决具体的用户问题,带来确定性事件。

同一客服问题下Coze“助手”与TFlow“任务”的对比

都选择常见售前留咨为例如,流程为:1、查询知识库进行解答问题;2、引导用户提供姓名、电话、公司名称;3、调用接口,讲信息插入到CRM中;Coze和TFlowAi的对比;

WechatIMG445.jpg

通过相同任务提示词的对比我们发现,框架微调的Agent,更能适合客服场景,能够很好的聚焦,模型不会随意的发散。表现更好的准确性,任务执行的稳定性,以及控制他的幻觉。


“任务”Agent 客服机器人(如TFlow)优势亮点

相比于传统SaaS,不容易被抄袭,容易形成核心竞争力

1、场景微调:针对客服场景进行了专门适配,基于客服场景经验,优化多Agent与大模型的对话逻辑。实现一次客服会话中,同时交叉使用多个Agent,同时处理不同的任务。优化后能够准确识别用户意图,并进行切换处理。

2、优化流程式任务的处理:发挥Agent框架中的“思维链”和“反思”能力,让模型模型理解流程,观察用户输入,不断的反思,从而更能准确的执行任务。优化后能够根据提示词的任务,更精准地理解用户意图,按照提示词流程处理客服场景中的复杂任务,自主引导用户提供信息并执行任务。而且表现很高的稳定性和准确性。

 

和传统SaaS客服机器人相对优势

 

1、开发成本低:传统aaS的智能客服机器人依赖于知识图谱、FAQ、相似度问题、配会话逻辑等,需要庞大的开发团队进行维护复杂的功能模块,且需要专业的团队进行使用

2、使用成本低:通过自然语言来描述服务SOP就能创建的机器人,自动识别用户多种意图。不需要配置相似度问题、配会话逻辑等。

和钉钉、coze相比:能够直接服务于企业业务流程,直接落地。解决实际业务上的问题,实现降本增效。

为什么B端Agent的机会,而在基于垂直领域的任务式Agent?

个人两个观点:

1·、助手更多是提高员工的效率,也依靠员工适用于Ai的能力,个人的能力无法长期转变为组织的效能。而B端产品的价值必须给企业带来价格,降低成本or带来收益。通过微调Agent能够落地到企业业务中。

2、通过微调,适配业务场景的任务Agent,能够带来一定的壁垒。传统软件通过产品交互逻辑即可推测产品的实现逻辑。而通过大量场景的适配微调的Agent,通常无法通过产品直接推车出微调逻辑。随着时间的推移,更能带来一定的壁垒。


附上产品体验链接:
官网:https://tflowai.haoqishijie.com/

产品手册:https://docs.qq.com/doc/p/1d47054927d198d56ae95e8e13d45d9a58567b40

相关文章
|
6月前
|
机器学习/深度学习
智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%
【4月更文挑战第20天】DS-Agent是结合案例推理(CBR)和大型语言模型的新研究,旨在提升自动化数据科学任务效率。通过自动迭代管道,它能理解任务、构建模型并优化性能。在开发阶段,成功率高达100%,部署阶段平均提高36%的一次通过率,降低成本,使开源LLMs也能高效处理数据科学任务。然而,LLMs的生成问题和资源限制仍是挑战。论文链接:https://arxiv.org/pdf/2402.17453.pdf
142 4
|
6月前
|
物联网 测试技术 API
用消费级显卡微调属于自己的Agent
本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列
|
24天前
|
前端开发 API 决策智能
多智能体微调实践:α-UMi 开源
近年来,为了加强大型语言模型(Large-Language Models, LLM)实时信息处理、解决专业问题的能力,催生了工具调用智能体(Tool Integrated Agent)概念
|
6月前
|
物联网 测试技术 API
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
LLM 大模型学习必知必会系列(九):Agent微调最佳实践,用消费级显卡训练属于自己的Agent!
|
2月前
|
自然语言处理 决策智能 Python
同时操控手机和电脑,100项任务,跨系统智能体评测基准有了
【9月更文挑战第9天】近年来,随着人工智能技术的进步,自主智能体的应用日益广泛。为解决现有评测基准的局限性,研究人员推出了CRAB(Cross-environment Agent Benchmark),这是一种支持跨环境任务的新框架,结合了基于图的精细评估方法和高效的任务构建机制。CRAB框架支持多种设备并可轻松扩展至任何具备Python接口的环境。首个跨平台基准CRAB-v0包含100项任务,实验显示GPT-4单智能体在完成率方面表现最佳。CRAB框架为智能体研究提供了新机遇,但也面临计算资源和评估准确性等方面的挑战。
61 9
|
3月前
|
人工智能 监控 决策智能
震惊!多角色 Agent 携手合作,竟能如此高效搞定复杂任务,背后秘密大揭晓!
在复杂任务环境中,单个智能体常因能力与资源限制而难以应对。多智能体系统(multi-agent systems)通过将任务分解并分配给各具专长的智能体,实现了高效协同工作。例如,在物流配送中,不同智能体分别处理路线规划、货物装载与交通监控,确保任务准确高效完成。同样,在大型游戏开发项目里,各智能体专注剧情设计、美术创作等特定领域,显著提升项目质量和开发速度。通过共享信息、协商决策等方式,多智能体系统展现出强大灵活性与适应性,为物流、软件开发等领域带来新机遇。
91 2
|
3月前
|
决策智能 Python
"携手并进,共创未来:多角色Agent协同作战,如何以智能融合的力量高效征服复杂任务新挑战!"
【8月更文挑战第21天】多Agent系统集结多个智能体,通过角色分配、通信与冲突解决等机制高效协作,完成复杂任务。智能体根据各自能力和任务需求扮演不同角色,通过有效沟通及任务分解,实现资源优化配置与目标协同达成,展现出高灵活性与适应性。
87 0
|
4月前
|
人工智能 JSON 数据格式
[AI CrewAI] 你来当老板,组建AI团队,协作AI Agent完成任务
[AI CrewAI] 你来当老板,组建AI团队,协作AI Agent完成任务
|
6月前
|
测试技术 决策智能
专业智能体指导让小模型学会数学推理!微调Mistral-7B实现86.81%准确率
【5月更文挑战第13天】Orca-Math研究展示如何用小模型解决小学数学题,通过70亿参数的SLM在GSM8K基准测试上达到86.81%准确率。采用合成数据集和迭代学习技术,包括多智能体协作创建问题集及“偏好学习”优化解决方案。虽优于其他大、小模型,但可能不适用于复杂数学问题,且依赖高质量合成数据集的创建。[论文链接](https://arxiv.org/abs/2402.14830)
162 4
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理