GPTs大受欢迎但问题多,企服软件厂商的AI Agent更被B端客户器重

简介: 大部分AI Agent还在讲概念谈愿景阶段,GPTs大受欢迎但问题也不少,这种情况下企服软件厂商推出AI智能体更被B端客户器重。

  • GPTs大受欢迎但问题多,企服软件厂商的AI Agent更被B端客户器重
  • 比尔盖茨预言智能体是下个平台,超自动化平台的AI Agent更靠谱?
  • 以GPTs为代表的AI Agent只是玩具?揭秘真实可用AI智能体长什么样
  • AI Agent应用落地前半场,属于企服软件厂商推出的平台级AI智能体


文/王吉伟


OpenAI在首届开发者大会上推出了GPTs和Assitant API,不仅改写了AI Agent的构建范式,也把AI智能体的应用推向一个新高潮。

GPTs和GPT商店,使得用户无需编码通过自然语言就能创建并拥有多个专属私人助理,且可以如在苹果应用商店一样在GPT商店出售和购买这些专属助理。

这意味着,人人都能构建Agent的时代已然到来,Agent无处不在的序幕也已拉开。

OpenAI开发者大会之后,几个月前曾把生成式AI比作“图形用户界面(GUI)一般爆炸性技术革命”的比尔盖茨,再次发表长文表达其对AI Agent的看法。

他认为,智能体不仅会改变人与计算机交互的方式,还将颠覆软件行业,带来自人类从键入命令到点击图标以来最大的计算革命,智能体会成为继Android、iOS和Windows等之后的下一个平台。

有了行业大佬的背书,AI Agent的火爆程度再度跃升一个量级。即便目前99%的GPTs都在裸奔,两句话就能套走GPTs数据库,也阻挡不住人们开发与分享GPTs的热情。比如某第三方GPT Store显示的GPTs数量,已经多达1.3W+。

AI Agent大势所趋,已经成为LLM落地应用的主要途径。借着GPTs的火和比尔盖茨的风,很多LLM研发与应用厂商都打出了Agent的牌。反正早晚都要实现通用人工智能AGI,不管是概念阶段还是应用起步,先一步主打Agent必然没错。

概念化陈述的AI Agent与实体化应用的AI Agent,自然存在很大差距。随着类似信息越来越多,大众也就无感,以致于目前大部分人认为AI Agent十之八九名不副实,仅是玩具一般的存在。

AI Agent只是玩具?

AI Agent是不是玩具,取决于从哪个角度看。

个人使用它自动购买机票、订披萨、写总结、收发邮件,看起来已经是不错的生产力工具。比如使用GPTs通过Zapier的海量API连接更多商业应用,可以在很多业务场景中使用。

但现在市面上大多Agent,包括OpenAI推出的GPTs,不过就是构建了一个基于某知识库或者专业数据的Chatbot。使用这些智能体进行问答交互,比如获取行业资讯、报告等,都可以做到对答如流。

但在程序联动与操作方面还有很大差距,至少现在还无法用GPTs直接操作SAP或者金蝶等ERP系统,因为其中涉及到了API的应用、授权、维护以及无API管理软件的连接问题。

对于广大企业而言,如果GPTs等AI智能体只能用于知识问答,确实像一个玩具,因为它还无法深入到企业运营的业务流程中去。

所以,无论现在对AI Agent的讨论多么热烈,不管2W+的GPTs和大量第三方Agents展现的应用场景有多丰富,它们仍算是Agent的初级应用,尚无法深度参与及影响广大组织的业务经营。

当然其中的因素是多样且复杂的,比如LLM能力、Agent架构、Prompt精确性、数据集大小、知识库丰富程度等,都能影响Agent能力的体现。

这种情况下,当前大家所提到的AI Agent大部分都停留在idea阶段,成熟产品很少。

还有重要的一点,随着Agent的构建越发简单,Agent生态的成熟会让C端Agent出现百花齐放的局面,应用价值方面也随边际效应而无限趋向于更小量级。

由此AI Agent更大的价值,最终还是要落到B端的商业落地与量级应用。

这,也就是比尔盖茨所言的智能体的平台价值。

Agent平台的价值

比尔盖茨认为,智能体作为下一个平台,将会影响人们使用软件的方式以及软件的编写方式。它更擅长查找信息并为用户总结信息,能够会为用户找到最优惠的价格,将取代搜索网站及电商网站,也将取代文字处理器、电子表格和其它生产力应用程序。

并且,现在各自独立的搜索广告、广告社交网络、购物、生产力软件等,都将变成智能体这一项业务。

Agent会彻底改变应用软件的打开方式,这一点毋庸置疑。

而相对于Agent带来的影响,如何构建Agent以及由什么样的Agent平台去构建能力足够强劲的Agent,是大家更为关注的,也是更需要探讨的问题。

在这方面,OpenAI已经率先用GPTs以及GPT Builder为业界打了一个样。

即AI Agent平台本身就是AI智能体,也是智能体构建平台,还是Agent分发平台。为了让人们更方便的构建与应用各种Agent,它会基于构建-应用-分享-反馈的应用路径发展,并且Agent的架构逻辑与思维也会用于支持平台的整体运营。

平台属性意味着它不只用于构建和分发Agent,更重要的是能够为用户提供包括安全、运营、维护等在内的交付能力。不仅需要内置为用户构建智能体所需要的各种插件和组件,还需要能够在智能体构建过程中随时给予用户反馈以保证项目成功。

这几点,对于B端用户尤其重要。

像最近GPTs推出后OpenAI出现的各种安全问题,首先在数据安全上就过不了企业用户的关,不是私有化部署的用户可能都不敢构建GPTs,更不用说对外分享。

从业务流程角度来看,Agent的应用是在LLM的基础上进一步实现的业务流程自动化。而目前包括GPTs在内的各种AI智能体表现来看,普遍存在两种情况:

一是安全系数不过关,频频出现的数据泄露问题让广大组织望而生畏,而中小企业又没有能力私有化部署LLM;

二是Agent所带来的流程自动化仍停留于粗浅层面,尚无法为企业内部动辄几十上百种的业务系统提供业务流支持。

所以,AI Agent想要真正在B端实现大量业务场景的落地商用,需要综合考量其本身的安全性、技术发展周期是否成熟以及To B端的场景是否密切贴合等。

说到这里有人可能会问,连GPTs都存在那么多问题,现阶段企业想要应用AI智能体,就没有合适的解决方案吗?

当然有,下面我就会讲到。

企业级AI智能体平台

在讲述企业级AI智能体平台之前,我们先来看一个真实应用案例。

这是一个使用RPA智能体自动构建「从招行网银客户端下载交易数据(敏感信息打码)」自动化流程的应用案例,可以看到要构建这样一个自动化流程,只需在TARS大模型对话框输入“打开客户端,查询默认账号几年的交易数据,并下载导出”,TARS就能自动创建执行计划,点击执行它就能按照执行计划一步步去执行,等它执行完以后,一个可以复用的自动化流程也构建完成了。

使用这种方式构建自动化流程,人机协作的部分只有必要时人工才参与的点击功能按钮和必要元素,构建的全程不再需要“拖拉拽”各种组件和代码块,任何人随时都能构建需要的自动化流程。

案例所使用的AI智能体产品,是实在智能推出的RPA Agent智能体。这是一个能够自主拆解任务、感知当前环境、执行并且反馈、记忆历史经验的RPA Agent,进一步降低了数字员工的应用门槛。

实在智能凭借其自创业初就深深扎根在AI领域强大的自研能力和帮助大中型企业客户获取丰富的自动化落地解决方案的经验,在经历第一代专家模式RPA、第二代简易模式IPA之后,迭代成为现在的第三代对话模式RPA:融合TARS大语言模型的RPA Agent智能体。

实在智能垂直领域大模型TARS的推出,为RPA数字员工注入“TARS+ISSUT(智能屏幕语义理解技术)”双模引擎。双模互动构成了TARS-RPA-Agent,实现对屏幕上一切元素的自动化操作,并为行业带来“你说,PC做”全新工作布置方式,实现流程自动化创建的“所说即所得”。

这里“你说,PC做”的意思是,通过RPA智能体构建包括所有企业管理软件在内的自动化操作流程,而并非通过GPT builder等Agent构建平台构建类GPTs的轻量级Agent。如果说其他平台构建的Agent还是Agent工具,RPA Agent构建的Agent则是智能体数字员工。

RPA Agent智能体不只发挥了LLM理解与分析的优势,也保留了RPA特色,只要能够识别的元素全部都能实现自动化操作,可以面向包含API接口及UI自动化的所有管理程序构建自动化程序,因此完全可以用于企业运营的业务流程自动化构建。

超自动化平台推出的Agent更靠谱

企业要引入AI智能体进行流程优化,必须经过成本控制、投入预算、实现效率、安全管控等多方面严格及缜密的评估。这就要求技术供应商提供的必须是平台级解决方案,而不是只针对单一、个别场景需求来提供的智能体自动化解决方案。

越复杂的业务流程自动化,对智能体厂商平台的底层技术融合能力、数据安全性掌控能力、产品部署后的运营和维护能力、交付能力及产品和解决方案的可扩展能力等的要求也就越严格。这也对AI Agent技术供应商提出了更高的要求,必须具备丰富的帮助大厂实现超大和复杂业务场景自动化落地的经验。

同时,大型企业引入新的AI技术不允许任何试错成本,因此技术供应商给出的解决方案必须是开箱即用、具备行业KNOW-HOW术语和业务规则的真实智能体数字员工。也只有这样的标准化智能体,才能被纳入企业的内部编制中去统一管理和调度。

除此之外,要实现AI Agent更好地商用,需要考虑接口成本、隐私、管理、授权等诸多因素,这既是很多供应商的技术与产品门槛,也是广大企业选型的重要依据。

所以,企业在选择用于业务流程自动化的AI智能体时,也是优先考虑超自动化厂商推出的AI智能体产品,而不是选择LLM厂商推出的尚未成熟的通过API连接各种插件的单一智能体解决方案。

这种情况下,在B端市场,由ERP、BPM、超自动化等企业管理软件厂商推出的AI智能体反而更受关注。大部分企业会根据自身需求,选择能够结合业务特点、具备丰富流程自动化落地经验且能够解决更复杂更庞大业务流程自动化的需求的技术供应商,以快速实现新AI智能体解决方案落地。

这也是老牌RPA融合LLM后,更容易将智能体做成平台级别产品的原因。

就如推出RPA Agent智能体的实在智能,具备上面所列的多个先发优势:之前RPA、IDP、流程挖掘、ISSUT等所有产品组合都是按照平台级别打造的,现在的RPA智能体也是在之前超自动化平台的基础上融合LLM及Agent架构打造的。

它自诞生开始,就是比尔盖茨所说的平台级智能体产品。

如果你的企业想在Agent被视作玩具的眼下引入企业级AI智能体数字员工,实在智能RPA Agent智能体会是一个不错的选择。

后记:AI Agent前半场属于平台级AI智能体

在超自动化领域,很多人认为LLM厂商推出的AI Agent,可能会优先颠覆之前的RPA、低代码、工作流、流程挖掘等企业管理平台。

但现在的事实是,这些超自动化平台通过融合自有大语言模型或者集成第三方大语言模型API,在此基础上推出的AI Agent反而更胜一筹,无论在安全性方面,还是易用性、扩展能力等方面,都明显优于现在市面上其他Agent。

如果套上“LLM+规划+记忆+工具”这个Agent架构,RPA、低代码等都属于工具,但这个工具是融合AI等多种技术的平台级别工具,它与GPT等通过API调用的轻量级工具有着显著区别。

有的推出Agent智能体的厂商如实在智能,也推出了自己的垂直领域大模型,跻身成为大语言模型厂商,因此在Agent构建及技术架构方面可以有更多的选择以及灵活的策略。

更重要的是作为超自动化厂商,他们拥有更多的技术、工具、数据以及经验,可以基于自身优势打造更符合产品特性及用户属性的AI智能体,并能够为用户定制专属的个性化企业级AI智能体。。

这样的AI智能体能够更好地理解用户指令意图并为RPA等工具规划各种任务,更能够无缝融合及适配所有工具、数据、知识及经验。

目前而言,不管怎么对比,由企业管理软件厂商推出的平台级AI Agent明显要靠谱得多,且已真正实现落地商用。

AI Agent应用落地前半场,企服软件厂商的平台级AI智能体先跑出来了。

【王吉伟频道,关注AIGC与IoT,专注数字化转型、业务流程自动化与RPA,欢迎关注与交流。】

相关实践学习
基于阿里云短信服务的防机器人验证
基于阿里云相关产品和服务实现一个手机验证码登录的功能,防止机器人批量注册,服务端采用阿里云ECS服务器,程序语言选用JAVA,服务器软件选用Tomcat,应用服务采用阿里云短信服务,
目录
相关文章
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
谷歌最新推出的Gemini 2.0是一款原生多模态输入输出的AI模型,以Agent技术为核心,支持多种数据类型的输入与输出,具备强大的性能和多语言音频输出能力。本文将详细介绍Gemini 2.0的主要功能、技术原理及其在多个领域的应用场景。
112 20
Gemini 2.0:谷歌推出的原生多模态输入输出 + Agent 为核心的 AI 模型
|
10天前
|
人工智能 API 语音技术
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
TEN Agent 是一个开源的实时多模态 AI 代理框架,集成了 OpenAI Realtime API 和 RTC 技术,支持语音、文本和图像的多模态交互,具备实时通信、模块化设计和多语言支持等功能,适用于智能客服、实时语音助手等多种场景。
95 15
TEN Agent:开源的实时多模态 AI 代理框架,支持语音、文本和图像的实时通信交互
|
11天前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
74 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
8天前
|
机器学习/深度学习 人工智能 算法
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性
Meta Motivo 是 Meta 公司推出的 AI 模型,旨在控制数字智能体的全身动作,提升元宇宙体验的真实性。该模型通过无监督强化学习算法,能够实现零样本学习、行为模仿与生成、多任务泛化等功能,适用于机器人控制、虚拟助手、游戏角色动画等多个应用场景。
36 4
Meta Motivo:Meta 推出能够控制数字智能体动作的 AI 模型,提升元宇宙互动体验的真实性
|
19天前
|
人工智能 自然语言处理 JavaScript
Agent-E:基于 AutoGen 代理框架构建的 AI 浏览器自动化系统
Agent-E 是一个基于 AutoGen 代理框架构建的智能自动化系统,专注于浏览器内的自动化操作。它能够执行多种复杂任务,如填写表单、搜索和排序电商产品、定位网页内容等,从而提高在线效率,减少重复劳动。本文将详细介绍 Agent-E 的功能、技术原理以及如何运行该系统。
68 5
Agent-E:基于 AutoGen 代理框架构建的 AI 浏览器自动化系统
|
5天前
|
人工智能 数据挖掘
让客户主动找你!“AI销售助手”教你如何洞察客户痛点,实现高效成交!
在竞争激烈的商业环境中,销售团队常因无法洞察客户需求而难以促成交易。客户对销售信息的反馈通常寥寥无几,导致销售难以把握客户的真实需求。然而,随着“AI 销售助手”的出现,这一难题迎刃而解。通过精准的数据分析,AI 助手能够统计客户的点击、停留等行为,帮助销售团队深入了解客户痛点,提供针对性的解决方案,从而大幅提升成交率,开启销售工作的新篇章。
|
1月前
|
存储 人工智能 自然语言处理
AI经营|多Agent择优生成商品标题
商品标题中关键词的好坏是商品能否被主搜检索到的关键因素,使用大模型自动优化标题成为【AI经营】中的核心能力之一,本文讲述大模型如何帮助商家优化商品素材,提升商品竞争力。
125 13
AI经营|多Agent择优生成商品标题
|
19天前
|
人工智能 自然语言处理 数据挖掘
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
田渊栋团队提出Agent-as-a-Judge框架,利用智能体自身评估其他智能体的性能,不仅关注最终结果,还能提供中间反馈,更全面准确地反映智能体的真实能力。该框架在DevAI基准测试中表现出色,成本效益显著,为智能体的自我改进提供了有力支持。
35 7
|
27天前
|
人工智能 自然语言处理 搜索推荐
🤖【多Agent大爆炸】——灵活调用与实践指南,解锁AI协作新技能!
本文深入探讨了单Agent与多Agent在不同场景下的应用及优势,通过实例讲解多Agent如何实现高效协作,涵盖智能物流、教育、医疗等多个领域的实际应用,旨在帮助开发者掌握多Agent系统的调用与实践技巧。
94 5
|
27天前
|
机器学习/深度学习 传感器 人工智能
2024.11|全球具身智能的端到端AI和具身Agent技术发展到哪里了
2024年,具身智能领域取得显著进展,特别是在端到端AI控制系统和多模态感知技术方面。这些技术不仅推动了学术研究的深入,也为科技公司在实际应用中带来了突破。文章详细介绍了端到端AI的演化、自监督学习的应用、多模态感知技术的突破、基于强化学习的策略优化、模拟环境与现实环境的迁移学习、长程任务规划与任务分解、人机协作与社会交互能力,以及伦理与安全问题。未来几年,具身智能将在多模态感知、自监督学习、任务规划和人机协作等方面继续取得重要突破。
67 2