百度度秘机器人肯德基「上岗」:人工智能从实验室走入生活

简介: 4月25日,百度与肯德基联手打造的智能概念店「KFC original+」在上海市「国家会展中心」正式亮相,度秘机器人化身智能员工直接为消费者提供服务,消费者可以使用日常语言与度秘进行交互,完成从点餐到支付的全流程。

1、度秘机器人入驻肯德基概念店


4月25日,百度与肯德基联手打造的智能概念店「KFC original+」在上海市「国家会展中心」正式亮相,度秘机器人化身智能员工直接为消费者提供服务,消费者可以使用日常语言与度秘进行交互,完成从点餐到支付的全流程。

微信图片_20211126190806.jpg

度秘机器人化身肯德基中国首位智能员工服务消费者


这是一款集成了百度多种人工智能技术的实体机器人,消费者通过语音的方式与其交互,像其他语音类产品一样,每次交互时用户需要按下实体按钮进行触发,整个点餐过程需要「开始点餐」、「选定套餐」、「确认用餐方式(堂食/带走)」「订单确认」和「支付」四个环节,大约用时1分钟。其中,第一、三、四环节都比较确定,第二环节「选定套餐」则会涉及比较复杂的语音交互和语义理解,机器之心记者用几个在点餐过程中比较常用的问题对度秘机器人进行了几项测试:


1)在选套餐时,没有按照默认要求说出「某号套餐」,只提到套餐中的汉堡名称,系统也可以自动识别出是哪个套餐。


2)在确定用餐方式,没有按照默认要求说出「带走」,还是换成了「打包」,系统也可以识别出用户的意图。


3)选定套餐后进行修改也比较方便智能,比如一开始选定了3号套餐,然后用比较自然的语言说出「请帮我换成1号套餐」、或者「我不要3号套餐了,我要1号套餐」等命令,度秘也可以识别出来并进行套餐更换。


4)选定套餐后,度秘会说「还有什么我可以帮你?」测试员这时说「可乐不加冰」,面对这一具有挑战性的需求,度秘有些犯难:「您的需求可以在取餐时向服务人员说明哦,么么哒。请问还有其他需要吗?」

微信图片_20211126190839.jpg

肯德基智能概念店里可爱呆萌的度秘机器人


这是百度首次将人工智能技术应用于连锁餐饮行业,面临着现场噪音、用户点餐语音命令较为多样和灵活等难题。从现场体验来看,度秘能够完成基本的点餐任务,但由于语义理解本身的困难,应对和用户之间较为复杂的自然语言交互方面还存在进步空间。但总之,这是一次人工智能技术应用于特定应用场景的重要尝试,而且确实能够帮助用户解决问题。百度多模搜索部总监孙雯玉在接受机器之心采访时被问到「这是否是一款成熟的商业应用?」时,她回答说:「这要看怎么定义『成熟』,如果说和人比还谈不上成熟,但是如果你说可用,我觉得是可以(说成熟)的。」


2、度秘机器人首次进入生活服务场景 ,背后的人工智能技术创新


百度副总裁王海峰在启动仪式的演讲中提到:「百度通过不断的技术创新,索引真实世界将最符合用户需求的信息或服务及时准确的交付给用户。」而此次度秘机器人亮相肯德基,是百度人工智能技术进入人们线下日常生活服务场景的首次尝试,也是度秘首次从手机和互联网延伸到实体场景,极大扩展了度秘的应用范围。

微信图片_20211126190917.jpg

百度副总裁王海峰现场演讲


特定需求和实体环境也带来了很大的挑战,百度大搜索总产品架构师景鲲表示,双方最开始合作这个项目时,尤其是肯德基的同事,觉得这是一个不可能完成的任务。「我们开玩笑地说,这可能是世界上第一家真正把人工智能技术变成硬件放在商业场景里面去的,之前没有先例,但我们对自身的技术肯定是很有自信的。另一方面,肯德基从一个商业角度来说,希望做探索性的事情,但不知道这个事情能否成功,所以最开始我们探讨很多种可能性。这个事情在很短的时间内做成,大家回想起来觉得是一个很好玩的过程,很有成就感。」对于度秘的进步和新的阶段性任务的达成,孙雯玉也有同样兴奋:「肯德基的负责人说,把这个事情做成,就是把他们当初触碰的梦想落地实现。我们也是如此,背后的技术积累,百度做了很久,从发布度秘以后,我们也做了很多优化,从最早的手机端度秘到今天实体店应用,将度秘真正搬到现实场景,真正的跟真实的业务流程结合之后,变成和人可交互的场景,其实还是非常令人兴奋的一种体验。」


度秘能够作为一个生动形象的机器人出现在肯德基的门店里,带给用户新的体验并且可以高效的为用户服务,为肯德基节约人力,这主要源于百度对「连接人与信息及服务」这个目标的坚持、对特定应用场景的理解以及背后人工智能技术的积累。


对于连接人与信息及服务这个目标,王海峰表示:「此次与肯德基的合作是百度人工智能技术的一个里程碑,因为我们真正的让人工智能技术在现实生活场景为消费者提供服务,将百度连接人与信息及服务的能力从线上延伸到线下,通过技术创新把真实世界索引进我们的系统。」将度秘应用于智能点餐,不仅将其应用场景从线上扩展到线下,解决了现实世界的具体问题,还借助点餐这样一种真实场景提供了一次宝贵的继续锤炼和打磨度秘产品的机会,让其更好的适应现实情况,以期待解决更多问题,这是一个「度秘走出实验室,更多接触实际应用场景,变得越来越聪明、越来越有智慧的一个过程」。


在应用场景上,王海峰称之为「这是针对特定场景、特定应用所做的定制化开发。」肯德基作为需求方提供了两方面支持,首先是非常明确的现有产品,比如套餐内容等等;其次是提供了大概的业务逻辑和顾客的点餐流程。百度基于这两部分内容,结合多轮交互,进行系统的开发,然后在这个垂类下做更丰富的适应。这里的难度在于用户的讲话顺序和方式没有明确的逻辑做参考,比如说有的人先确定套餐,而有人会先说「带走」;有的人会说要1号套餐,而有的人会说我要全家桶套餐。对于这些问题的解决方案也像是肯德基培训店员一样,让机器基于各种情况去训练。「从我们的角度来讲,一开始我们的理解没有这么深,但我们会把这些表达拿过来让机器来学习,不停的迭代让我们去培训机器,我们就会慢慢交出他们很满意的产品。」


支撑度秘完成以上这些任务的是百度在多项人工智能技术方面的积累,王海峰表示:「这不仅体现了百度最先进的语音识别技术,还涉及到语言语义理解、对接服务能力等等,集成了百度很多最先进的技术。」针对智能点餐任务,百度使用了实体机器人,提供了软硬件结合的解决方案,在机器人身上配置了麦克风阵列,解决了收音的一部分问题,比如说噪音消除等。在软件方面,虽然语音是唯一的交互方式,但百度是通过语音识别、语义理解和搜索三方面的整合来提升识别精度,而非单纯依靠语音识别。孙雯玉表示:「比如说有一部分识别错了,但没有影响到句子主干的语义,后台的自然语音模块可以通过容错这个东西迈过去。」此前王海峰在「百度搜索媒体开放日」上提到,百度的语音搜索不是语音识别和搜索的简单相加,而是借助搜索改变语音识别,同时在搜索中进一步加工处理。百度的语音搜索包含语音技术、自然语言处理和智能搜索三方面,除了知道内容是什么,还要进行理解和思考,同时实现对用户需求的理解、对自身拥有内容的理解,以及对知识的掌握应用,从而更加智能的将用户需求和服务匹配起来。此次提供点餐服务的度秘机器人也体现出了这种对人工智能技术相关的整合和综合利用。

微信图片_20211126190935.jpg

百度副总裁王海峰接受机器之心记者采访


此次度秘的开发过程不是一个从零开始的过程,「我们后台积累的技术,以及积累的数据,实际是百度过去发展的十几年,以及互联网过去的十几年,大量的数据积累到现在的,最后是针对这个应用定制好的。」王海峰表示。


这对于度秘来说也仅仅是个开始,在语音识别和语义理解方面还有很多问题需要解决,但这样一个真实场景可以让度秘保持一种持续进步的状态。「度秘会在交互的过程中积累数据和学习,人工智能很重要的一点就是在场景中不断的学习。」王海峰说。因此,百度在和肯德基合作时非常看重样本丰富程度,「我们需要这些真实场景的数据,这样才能真正的把我们在这些场景的能力打造起来。你总得迈出第一步。目前所有的困难都在于,我们有技术基础,但是我们的整个数据不够丰富,所以度秘在这个场景下也得有一个学习和成长的过程。」孙雯玉表示。肯德基同事告诉景鲲,最近一段时间,每天都会感觉到度秘在变得更成熟。


除了度秘借助数据的自我学习和成长,百度也在积极的进行度秘新版本的开发迭代,孙雯玉说:「我们现在第一优先级的事情,还是打造度秘后台的能力,以应对更多的使用场景。」王海峰表示,基于上海话等方言版本正在开发中。


3、员工「度秘」服务消费者,人工智能走入生活


度秘和肯德基的合作是百度人工智能技术的一次落地,而且实现了从移动端到现实世界的过渡,面对王海峰所说的「未来我们将接入3600行,在更多场景下为消费者提供最优质的服务。」这个宏大目标,百度和度秘还将进行更多更广泛的探索,王海峰表示,度秘也正在探讨其他商业场景的应用。


王海峰在演讲中提到:「今年是人工智能概念正式诞生60周年,期间人工智能起起落落,走向高潮的时候是因为人们对人工智能有很高期望,认为它能做很多事情;而走向低谷的时候也是因为一些期望其实没有达成。而今天我们非常高兴地看到人工智能真正开始走进我们生活的方方面面,所以我相信人工智能会持续处在上升趋势。」


度秘的此次尝试不仅是解决了特定场景下的一个具体问题,更重要的是将人工智能技术带到了我们身边,让我们在关注人工智能概念、研究进展、行业趋势之余,可以在生活中切身感受到人工智能所带来的便利。


人工智能技术已经有着丰富的应用,谷歌、百度等公司会借助机器学习来改善搜索引擎的推荐算法和广告匹配;IBM 认知系统 Watson 可以辅助医生进行诊断;Facebook 人工智能平台以每秒 600 万次预测来推荐信息流;高盛使用机器学习进行海量金融信息处理;人机协同的「综合战略机器」可以帮助各类公司进行更好的商业决策;AlphaGo 征服了围棋。但对于普通消费者来说,经常会感觉到这些最先进的人工智能技术距离自己较远,在一定程度上无法享受到这些技术带来的便利。这一方面原因是人工智能的某些技术目前还达不到民用要求,另一方面原因是技术和大众应用场景的结合还不够完善。在这种环境下,度秘开启了一次勇敢的尝试,而随着人工智能技术的逐步完善和应用场景的持续挖掘,人工智能技术终将走入我们的生活。就像 Pedro Domingos 在《The Master Algorithm》一书中提到的「我们生活在一个算法的时代。」


对于大众来说,人工智能如何改变我们的生活,可以解决我们哪些问题,要比超级智能是否要主宰世界这样的话题更加实用。当然,人工智能对我们生活的渗透是个漫长的过程,而幸运的是,我们看到了一个不错的开始。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
4月前
|
人工智能 安全 机器人
无代码革命:10分钟打造企业专属数据库查询AI机器人
随着数字化转型加速,企业对高效智能交互解决方案的需求日益增长。阿里云AppFlow推出的AI助手产品,借助创新网页集成技术,助力企业打造专业数据库查询助手。本文详细介绍通过三步流程将AI助手转化为数据库交互工具的核心优势与操作指南,包括全场景适配、智能渲染引擎及零代码配置等三大技术突破。同时提供Web集成与企业微信集成方案,帮助企业实现便捷部署与安全管理,提升内外部用户体验。
447 12
无代码革命:10分钟打造企业专属数据库查询AI机器人
|
12天前
|
人工智能 机器人 Serverless
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
当云计算遇见具身智能,AI咖啡开启零售新体验。用户通过手机生成个性化图像,云端AI快速渲染,机器人精准复刻于咖啡奶泡之上,90秒内完成一杯可饮用的艺术品。该方案融合阿里云FunctionAI生图能力与安诺机器人高精度执行系统,实现AIGC创意到实体呈现的闭环,为线下零售提供低成本、高互动、易部署的智能化升级路径,已在商场、机场、展馆等场景落地应用。
安诺机器人 X 阿里云函数计算 AI 咖啡印花解决方案
|
5月前
|
人工智能 自然语言处理 安全
AI尝鲜:dify搭建AI对话机器人
本实验介绍如何在Dify中设置知识库并创建智能应用作为对话机器人,实现AI对话功能。例如查询电动汽车电池过充电保护试验的环境温度条件。实验步骤包括:一、安装Dify并通过计算巢部署;二、设置模型供应商,选择通义千问并配置API KEY;三、创建知识库,导入文件并设置文本分段与清洗规则;四、创建智能体,添加知识库和模型;五、与智能体对话,测试查询功能。通过这些步骤,您可以构建一个基于专有知识库的AI对话系统。
|
17天前
|
机器学习/深度学习 人工智能 机器人
AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人
AI Compass前沿速览:Nano Bananary、MCP Registry、通义DeepResearch 、VoxCPM、InternVLA·M1具身机器人
|
18天前
|
人工智能 Java 机器人
基于Spring AI Alibaba + Spring Boot + Ollama搭建本地AI对话机器人API
Spring AI Alibaba集成Ollama,基于Java构建本地大模型应用,支持流式对话、knife4j接口可视化,实现高隐私、免API密钥的离线AI服务。
369 1
基于Spring AI Alibaba + Spring Boot + Ollama搭建本地AI对话机器人API
|
6月前
|
人工智能 搜索推荐
「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为
SocioVerse是由复旦大学联合小红书等机构开源的社会模拟框架,基于大语言模型和千万级真实用户数据构建,能精准模拟群体行为并预测社会事件演化趋势。
364 2
「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为
|
3月前
|
人工智能 数据可视化 安全
NekroAgent - 一体式跨平台多人AI智能聊天机器人框架
NekroAgent 是一个基于 AI 的智能聊天机器人框架,起源于 QQBot 插件,现发展为独立、功能强大的平台。它支持多平台适配、代码生成与安全沙盒执行、可视化管理界面,并具备高度扩展性与多模态交互能力,适用于 Linux、Windows、MacOS 系统部署。
145 0
NekroAgent - 一体式跨平台多人AI智能聊天机器人框架
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3模型升级、字节GR-3机器人、TRAE SOLO、JoyAgent OxyGent京东智能体框架、智谱Z.ai炫酷PPT制作
AI Compass前沿速览:Qwen3模型升级、字节GR-3机器人、TRAE SOLO、JoyAgent OxyGent京东智能体框架、智谱Z.ai炫酷PPT制作
AI Compass前沿速览:Qwen3模型升级、字节GR-3机器人、TRAE SOLO、JoyAgent OxyGent京东智能体框架、智谱Z.ai炫酷PPT制作
|
3月前
|
机器学习/深度学习 人工智能 机器人
Meta AI Research:虚拟/可穿戴/机器人三位一体的AI进化路径
本文阐述了我们对具身AI代理的研究——这些代理以视觉、虚拟或物理形式存在,使其能够与用户及环境互动。这些代理包括虚拟化身、可穿戴设备和机器人,旨在感知、学习并在其周围环境中采取行动。与非具身代理相比,这种特性使它们更接近人类的学习与环境交互方式。我们认为,世界模型的构建是具身AI代理推理与规划的核心,这使代理能够理解并预测环境、解析用户意图及社会背景,从而增强其自主完成复杂任务的能力。世界建模涵盖多模态感知的整合、通过推理进行行动规划与控制,以及记忆机制,以形成对物理世界的全面认知。除物理世界外,我们还提出需学习用户的心理世界模型,以优化人机协作。
150 3
|
3月前
|
人工智能 自然语言处理 监控
生成式AI客服实战:智能客服机器人5大自动化能力处理80%高频咨询,释放60%客服人力
生成式AI驱动的智能客服机器人通过五大核心能力自动化处理80%高频咨询,释放60%客服人力。以合力亿捷方案为例,融合大模型与业务知识图谱,实现服务精准化、决策智能化,推动企业服务成本下降超40%。
319 0

热门文章

最新文章