阿里巴巴孙健:关于人机对话交互的思考、实践和未来展望

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 人工智能的出现使得传统交互的本质发生改变,从原来非常确定性的行为变成了非常开放的行为。阿里巴巴智能服务事业部资深算法专家、阿里巴巴智能服务事业部北京团队负责人孙健在《云栖大讲堂第三期|未来人机交互技术沙龙》围绕云小蜜平台上的交互,带大家一起了解人机交互正在发生的深刻变革。

摘要:人工智能的出现使得传统交互的本质发生改变,从原来非常确定性的行为变成了非常开放的行为。阿里巴巴智能服务事业部资深算法专家、阿里巴巴智能服务事业部北京团队负责人孙健在《云栖大讲堂第三期|未来人机交互技术沙龙》围绕云小蜜平台上的交互,带大家一起了解人机交互正在发生的深刻变革。

数十款阿里云产品限时折扣中,赶紧点击这里,领劵开始云上实践吧!

本场技术沙龙回顾链接:大咖分享 | 人机交互技术需要什么样的创新?



演讲嘉宾简介:

孙健,阿里巴巴智能服务事业部北京团队负责人。他主导的自然语言处理基础平台有力支撑和服务了淘宝搜索、阿里妈妈广告等核心业务,主导了阿里巴巴自然交互平台(Natural User Interface, NUI)的设计开发,NUI平台广泛应用于天猫魔盒、互联网汽车等各种设备中。目前他正带领团队打造面向全行业的企业智能服务对话机器人(云小蜜),从而让每一家企业/组织能够及时响应用户的需求,与用户进行7*24的自然交互。

以下内容根据演讲嘉宾PPT以及视频整理而成(云栖社区做了不修改原意的编辑)。

879986002277b2b426841a0614e5555c6fc9503b

本次的分享主要围绕以下四个方面:

1. 传统交互到对话交互的本质改变是什么?
2. 正在发生的变革:AI正在重构B-C的关系模式
3. 智能客服在阿里的实践:小蜜产品家族
4. 小蜜开放平台和未来展望

一、传统交互到对话交互的本质改变是什么?

我们先考察一下传统交互方式,比如手机淘宝APP的一个页面,网页内容很丰富,其实不外乎就是一些链接和按钮。点击链接和按钮后的action都是经过产品经理严格定义好的,action是完全确定的,由于产品设计和测试的相对完备性,确保了用户在使用APP时有非常好的体验。而到人机对话交互的场景,这些场景都是开放的,在开放的场景中用户可以与机器表达任何内容,机器要理解用户说的所有内容并作出准确的反馈和actions,这基本是不现实,这都给交互带来了非常大的不确定性。因此,从我看来,传统交互到对话交互的变化,最本质的改变在于从确定性的行为变成了不确定的行为。

55709083ebc93280d93c44a30a8a588fe53be8d0

对话交互有两类非常典型的应用场景:

1. 以设备为中心的智能助理(例如机器人,智能手机,智能音箱,智能汽车等);
2. 企业服务智能化。即智能客服,比如在金融、电信、旅行、健康等各行各业都有进行巨大升级和改造的机会。

下面分析一下上面两个场景,哪一类场景不确定性更大。由于以设备为中心的智能助理所在的场景是完全开放的,用户可以随时随地问机器各种各样的问题,机器没办法很好的准确理解用户意图,因此不确定性更大,这也带来用户体验的显著下降。而相对于企业服务智能化场景,比如,用户到了淘宝/天猫平台,用户问的基本都是购物相关的问题;而用户到了招商银行,问的可能是和金融相关的问题,所以,这里隐含了对场景的限定。有了对场景的限定之后,这类场景的对话交互才有更多的确定性,从而在当前技术手段有限的情况下,能让用户在这个场景下的对话交互有一个相对较好的体验。

因此,从场景是否开放、行为是否确定、产品体验能否达到用户期望这个视角来考察对话交互的话,以设备为中心的智能助理产品的对话交互在未来3年甚至5年时间都难以达到满意的用户体验;而以企业/组织为中心的对话服务机器人则可以达到更好的对话交互体验,为企业/组织创造更大的商业价值。


二、人工智能正在重构B-C的关系模式

我们认为,企业(B)和消费者(C)之间的关系可以总结为三个时代。第一个时代是以销售为中心的时代。企业生产出产品之后,只在销售环节和消费者建立一次性的连接。产品卖出之后,企业和消费者的连接就中断了。企业不知道产品卖到了哪里,也不知道用户有没有使用、使用中有什么问题,所以企业和消费者之间的联系是不畅通的(用虚线来标示)。这是第一代企业-消费者生态模式,其典型特征就是以销售为中心。

3fbf873d843e4357e5c53c0206b121ac64c7a6e7

第一代企业-消费者关系模式

第二个时代可以称之为单向连接时代。每个企业都意识到与用户建立连接的重要性,把产品卖到消费者手里之后,还希望能够继续保持和消费者的连接,维护企业的用户和粉丝群,可以使用的方式有网站、微信公众号和微博公众号等。但是,这些连接方式本质上都属于单向的信息推送、发布,还没有实现基于自然语言对话的双向交互。

023624b5818c2735f686f379c1d49010b6400ca5

第二代企业-消费者关系模式

第三个时代可以称之为双向交互时代。企业和消费者之间的连接从第二阶段的单向连接变成双向连接,这意味着不仅企业可以发起和消费者的沟通,用户也可以主动地和企业进行对话。双向交互的实现不可能靠堆人力,而必须依靠人工智能的力量,依靠虚拟的企业智能服务对话机器人。它可以提供两个核心价值。第一个核心价值是为企业提供自然交互式的全链条服务,这里说的全链条包括售前智能营销、售中智能导购、售后智能服务。第二个核心价值是为消费者打造7×24小时的自然交互体验。在我们所设想的第三代企业-消费者生态模式中,企业和消费者之间有更多的自然语言交互,且更具有粘性,消费者对企业各个环节的决策更具有影响力。在未来,每个企业的形象和品牌认知将不再是一个静态的logo,而是一个懂客户心理、能自然会话的更具灵性的机器人。因此,第三代企业-消费者生态模式将具有以下核心特征:自然语言交互、7*24小时服务、双向实时交互、全链条和精准营销。

21360f25c4998dc92605d99f82907c46e69568bd

第三代企业-消费者关系模式

有人会说这不就是智能客服吗?非也,这和咱们平常所说的智能客服有本质不同,可以归结为以下三点:

c6491ad8a615aaeb65a9b7ea1c0b925adba9b257

第一,一般意义上的智能客服通常指售后,但第三代企业-消费者生态模式中智能服务是全链条的,从生产、营销、销售到售后。第二,业界在谈论智能客服的时候,经常说的是智能客服帮企业节省了多少人力,降低了多少费用。而在新一代生态模式中,这不是最关键的,我们从来没有看到哪个企业仅仅通过降低成本就能发展壮大的;智能化的企业服务还必须能够通过交互式的精准服务了解用户需求,通过交互式的精准营销提高营收,这才是智能服务所能给企业带来的最大价值,也是智能服务的核心所在。第三,从技术的角度来说,目前的智能客服通常只能实现较为简单的单轮问答,没有多轮对话的能力。和传统的智能客服相比,第三代企业-消费者生态模式不仅能实现全链条服务和精准营销服务,还具备支持多轮对话的自然交互能力。


三、智能客服在阿里的实践:小蜜产品家族

下面分享一下阿里巴巴在智能客服领域的实践。下图展示的是第一代交互模式,在2015年之前,用户无论通过在线、电话还是线上申请的方式,都需要企业的后台客服人员来应答。这种模式带来的弊端有:增加服务压力,服务成本快速增长;服务时间受限,处理不及时;服务弹性较差,每到大促热线就爆掉;消费者的体验要求急剧提升,远不是增加员工能够cover的一个挑战。

9ee6f0e2a22239f9ab6712bb95f561b8cb40742a

在2014-2015年,淘宝/天猫对客服产品体系进行一次大的技术升级,围绕问题咨询引入了一套智能对话体系,同时为交易纠纷引入了一套智能决策体系。通过这次技术升级,我们完成了客服产品从数据化到智能化的跨越。

8ab9ad51f8685b8354912cf6af819cc27c851be9

下面主要介绍智能人机对话体系,也就是小蜜产品家族。小蜜家族如下图所示分为几个成员:阿里小蜜、店小蜜以及云小蜜。阿里小蜜连接的是消费者与阿里巴巴平台,如大家了解的那样,在整个购物过程中,消费者有时是与平台打交道,到了一家店铺之后,消费者又开始与商家打交道。消费者通过阿里小蜜,就可以与淘宝,天猫,菜鸟各个平台进行交互,比如查看物流状态、修改收货地址等等。

店小蜜连接的是消费者与淘宝,天猫等平台上的每一个商家,可以理解为淘宝/天猫平台上的每个商家都有一个对话服务机器人,实时响应消费者的需求以及咨询。阿里巴巴在过去四年中,在智能客服领域中打造并沉淀了一套完整的技术体系和产品体系,这样的体系除了服务于阿里集团的生态体系内各个业务,我们还与阿里云一起合作打造云小蜜,进而赋能给阿里巴巴生态圈之外的各行各业,例如电信、金融、旅游、房产、健康等行业。

8cee3859d329cde37b337247ff5db245ca5830de

阿里小蜜和店小蜜这两个产品线,在2017年双十一当天,总的问答数是1.2亿次,这应该是世界上最大的单一人机对话系统;当天总的服务人数为4000万,智能服务占比为95%,也就是说只有5%的消费者问题需要人工回答。


四、小蜜开放平台和未来展望

下面我着重分享一下云小蜜。云小蜜是面向企业或者组织的新一代智能服务整体解决方案,方案分为两个部分,一个是对话机器人开放平台,另一个是机器+人协同工作台,只有这两者结合在一起,才能真正帮助企业与他们的客户有更加智能的交互,提供更好的服务体验。

c2d4e9c736223d79af96bb76379af910394c782a

云小蜜的架构如下图所示,最下面一层表示各行各业对领域知识的加工,云小蜜团队将提供易用、强大的行业知识加工工具给各行业的开发者/知识工程师用;再上面有三套引擎,分别是语言理解引擎、对话引擎和问答引擎;三个引擎上面有一套平台进行支撑。

78e250bfa651fa9dc88d1ab360c8a6bf6afadfcf

这里简单介绍一下三个核心引擎。在语言理解引擎这块,一方面我们会提供强大的系统内置能力以降低开发者的工作量,另一方面我们打造尽可能简单易用的工具来满足各个行业开发者的定制要求。

4710a005b3b86584e88208db1ead758f72ec52a2

对于对话引擎的设计,我们有以下3个方面的思考:可扩展性、鲁棒性、可定制线。在可扩展性方面,主要想法是要让业务逻辑/业务流程与核心对话引擎分离,从而能够快速扩展到更多行业、更多企业、更多Task;同时也需要具有鲁棒性,支持一个企业内多个Task之间的跳转与恢复,支持各种异常处理和验证;另外还需要支持可定制性,以Graph为出发点构建对话流程,支持复杂业务对话逻辑的自由流转,同时支持客户自定义Function,用户可以基于强大的Function功能,进行API请求、处理Slot冲突、生成回复、自定义结果展示等。

44337e4965c3386c57811da3631f897e004e48cc

在问答引擎方面,我们会针对不同类型的数据(FAQ对、结构化知识图谱、非结构化文档)打造不同的算法方案。下图是云小蜜与某一家电信运营商合作时,围绕客户数据加工好的知识图谱片段,比如围绕着任我看视频流量包,对它的介绍、收费标准、办理方式、办理条件、以及变更规则都做了结构化,有了结构化之后,就能实现比较精准的问答。

410f4d49cd90262e6805ab7eef4f2e25f2c11547

目前云小蜜已经与电信、金融、教育、保险、税务、航空等行业的客户深度合作并已经投入使用。云小蜜平台的核心价值总结有以下几点:有了多行业结构化知识,使得启动更容易;有了自主定制能力,业务更灵活;持续学习进化,体验更智能。

5376270210d86cad19ac577a7c0b12d3dc73eacc

最后,小蜜的梦想是和合作伙伴一起紧密合作,为每个商家、每个企业、每个组织打造一个智能对话服务机器人。这样,每个商家、每个企业、每个组织都通过各自的智能对话服务机器人来承载它与其客户的连接互动,从而更精准的了解客户,服务好客户,为客户创造更大价值,真正做到以客户为中心,真正做到客户就是上帝。

ccb3e4fef15886d7f72b7a9cd7d27a9554b58b60

本文由云栖志愿小组沈金凤整理,编辑程弢

相关实践学习
阿里巴巴智能语音交互技术与应用
智能语音交互,是基于语音识别、语音合成、自然语言理解等技术,为企业在多种实际应用场景下,赋予产品“能听、会说、懂你”式的智能人机交互体验。适用于多个应用场景中,包括智能问答、智能质检、法庭庭审实时记录、实时演讲字幕、访谈录音转写等。 本课程主要讲解智能语音相关技术,包括语音识别、人机交互、语音合成等。  
相关文章
|
4月前
|
自然语言处理 语音技术
|
4月前
|
人工智能 算法 人机交互
FunAudioLLM技术深度测评:重塑语音交互的未来
在人工智能的浪潮中,语音技术作为人机交互的重要桥梁,正以前所未有的速度发展。近期,FunAudioLLM以其独特的魅力吸引了业界的广泛关注。本文将以SenseVoice大模型为例,深入探索FunAudioLLM在性能、功能及技术先进性方面的表现,并与国际知名语音大模型进行对比分析,同时邀请各位开发者共同参与,为开源项目贡献一份力量。
97 4
|
6月前
|
存储 人工智能 自然语言处理
LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理
LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理
LLM技术全景图:技术人必备的技术指南,一张图带你掌握从基础设施到AI应用的全面梳理
|
机器学习/深度学习 人工智能 自然语言处理
《完全读懂AI应用最前线》 | 一线技术人、媒体人为你讲述AI最新应用
人工智能的历史是「热潮」与「低谷」交替出现的历史。发展热潮中充满无限期望,人工智能超越人类智能、强人工智能通用化实现等话题被屡屡提及,但是事与愿违,它最终走向了衰败。时至今日,作为第 3 次发展热潮的主角「深度学习」开始走向商业化,众多 AI 技术不断进入我们的生活,社会对人工智能抱有极大的期待。
254 0
《完全读懂AI应用最前线》 | 一线技术人、媒体人为你讲述AI最新应用
|
机器学习/深度学习 数据采集 自然语言处理
AIGC 与传统教学相结合
帮助学生更好地理解编程概念和实践技能。下面是一些可能的技术或模型的整合和搭建:
202 0
|
机器学习/深度学习 自然语言处理 算法
ChatGPT 背后的技术路线问题
ChatGPT 背后的技术路线问题
602 0
ChatGPT 背后的技术路线问题
|
机器学习/深度学习 人工智能 自然语言处理
ChatGPT背后的技术和多模态异构数据处理的未来展望——我与一位资深工程师的走心探讨
上周,我和一位从业三十余年的工程师聊到ChatGPT。 作为一名人工智能领域研究者,我也一直对对话式大型语言模型非常感兴趣,在讨论中,我向他解释这个技术时,他瞬间被其中惊人之处所吸引🙌,我们深入探讨了ChatGPT的关键技术,他对我所说的内容产生了浓厚的兴趣,我们开始交流并分享了各自的经验。我发现,与这位资深工程师的讨论不仅加深了我的理解,也让我更加了解了这项技术的前沿发展🌱。 后续我也下面我将分享一些我在与工程师的讨论中和自己学习中所了解的ChatGPT的关键技术,希望对您有所帮助。
|
存储 人工智能 自然语言处理
AIGC背后涉及到的几个技术解读、AIGC未来的演进趋势、AIGC的畅想
AIGC背后涉及到的几个技术解读、AIGC未来的演进趋势、AIGC的畅想
727 0
|
人工智能 自然语言处理 达摩院
人机对话技术现状|学习笔记
快速学习人机对话技术现状
人机对话技术现状|学习笔记
|
机器学习/深度学习 达摩院 机器人
人机对话技术现状|学习笔记
快速学习人机对话技术现状
人机对话技术现状|学习笔记