你是否对2016年云栖大会现场直播的实时字幕好奇?是否想了解语言方面的智能化怎样与客服相结合,怎样在客服智能化上落地?其实,收集数据是我们面临的最大挑战,这是时间、人力成本等的核算的问题。技术上,任何一个语言,包括英语、汉语、方言等等,难度差别并不多,识别相对简单,难点在数据。
传统客服模式不能满足业务需求
阿里最初开始做智能客服的时候是因为阿里自己的客服团队。公司业务规模很大,客服数量也非常大,到了一定的规模之后,就会发现整个客服的人力成本是高昂的。进一步说,很多时候靠增加人来解决问题已经变得不可能了,因为管理成本、培训成本、人员流动性导致客服服务已经不能够通过增加人来实现更大的收益。此时,我们就得通过其他的手段,不通过人员的增加来支撑越来越大的服务规模。我们在切入的过程中,会遇到以下四个问题:团队培训难度大;服务质量无法把控;知识库不完整、分散在各处,质量不好控制;沟通模式发生了变化。
服务智能化势在必行
上图是去年双十一阿里尝试的虚拟客服咨询。在你打进去电话之后,机器人会进行判断,其实他用了两种信息——你的行为以及你说的话来判断你遇到哪些问题,只有不是自助可以解答的问题才会转到人工咨询,而且会分到特定的技能群。
【大数据+人工智能】驱动服务智能化
其实这些智能客服的背后是交互层。今天我们的客服是由所谓的热线(通过电话),还有在线(通过各种即时通讯)来实现的,他们的入口可能是各方面。用户进来的时候实际上遇到的就是机器人,这个机器人可以通过你的行为预测你遇到的问题,根据遇到的问题来判断是否使用人工服务。所以,最开始的是问题的定位和分流。当电话打进来的时候,会有一个身份的判断,这个判断与过去你的行为息息相关。当信息量不足时,虚拟客服会问一些问题让你来澄清自己的问题,再此基础上,最后会得到你所遇到的问题。这样,之后的业务逻辑就会将问题转给机器人或者人工回答。
服务机器人
服务机器人也是同样的道理。我们输入的是一些自然语言和一些行为。问答引擎的后面有不同形态的知识库,另外的一种数据是知识图谱,讲的是各种东西之间的关系,还有一种是类似“小冰”这样的开放式聊天。所以,机器人的背后会有不同的数据,不同的数据又会对应不同的模型。这个过程的难点在于:用户说什么话都得去理解,真正明确他的目标是什么,然后把答案给他。
那么知识库从哪里来呢?最初可能是由人工写的。当公司做大之后,这种方式就变得不适合了,此时就会从公司的各种资料、各种文档里面去挖掘,或者从互联网上去寻找、挖掘。比如说,自己产品的问题,当自己的客服还没有总结出知识库的时候,在互联网上的某个论坛,大家已经谈论过这个问题了。不难看出,在服务机器人的智能过程中,有两点很重要:一是把人和我已有的知识关联起来,二是背后要有足够的知识库来支撑。
挖掘数据的价值洼地:语音转文本
另外一个很大的应用前景是我们做语音识别可以帮助挖掘以前对于大家可能认为没有价值的数据。语音转文本的过程中我们认识到两点:一是语音技术是靠技术驱动的,如果我们想要识别得越来越准就意味着我们必须不断地学习,人工智能的模型需要数据让它转起来。第二点,以前没有利用价值的语音一旦变成文字之后,我们可以用于很多方面,比如质检。以几千人的服务团队为例,其实很难把控每个人的服务质量,以过去的抽查方式,按1%的比例来看是杯水车薪的,现在我们可以通过智能语音转文本做到100%的质检。
此外,在这个过程中,用户和我们的客服之间的讨论中会有很多关于产品体验的问题,有了这些信息之后,我们就会知道哪些产品在什么地方有问题,或者什么特征是大家喜欢的、哪儿问题是最多的,还有一些包括异常的监控,就像去年518的断网导致很多应用出现问题。发生这种情况的时候,第一时间会有很多客户拨打客服电话,如果发现的快,就能及时解决这些问题。实际上,阿里提供的是前面的基础能力,每个业务会最终落地到自己的业务系统上,把数据的价值充分发挥出来。
案例分析
服务宝-智能质检
以前的通话语音只有1%被质检。其实通话中会有很多的营销机会,特别是对金融机构,用户可能是咨询一些投资、理财产品的信息,如果我们能够抓住这些信息,那么主动呼叫的业务会有很大的发展。用户的各种产品反馈,如果发掘到会有很高的利用价值。从图中不难看出,智能语音识别只需更少的人就能够达到100%质检的目标。当然,不能说100%的质检都会准确,因为机器学习的算法不能保证是百分之百准确的,但是系统抽出来的都是最大嫌疑的,所以在关键问题上需要有专门人来审核。
支付宝钱包-我的客服
在支付宝钱包里我的客服里,可以通过语音来提问,很多标准化的问题都可以自助的解答。
这个与其他有些区别,最开始也是在做客服,逐步的把服务推介、生活服务都打通,包括导购。显然,这是挖掘数据价值的典型案例。
语音识别助力行业变革
这个是今年三月份第一次做出来的,当时在阿里云的年会上做主题演讲的转写。与第50届世界速记大赛亚军进行PK,最后的结果是机器稍微好了一点。现在的云栖大会,都会用机器来打实时视频字幕,相当于给所有的会议做了一个纪要。
智蚁云客服
阿里智能客服第一个落地的是智蚁云客服。其核心思想是:整个的智能客服是帮助人来解决问题,所以并不是要求完全排除掉人,而是机器能解决的话就解决,不能的话再交给人来处理。
总结
语音交互所谓的智能化就是理解大家说的话,把我们的要求变成一个标准化的查询。从某个角度,你可以认为是对数据资源的查询,知识背后的数据资源可能是不一样的。现在的支付宝可将应用进行快速的直达,就是说我们可以用语音的技术,包括自然语言的理解和人机的多轮对话快速的让我们找到我们想要寻找的信息。其实,这样的系统,背后还是需要一个强大的数据支撑,如果理解到了,却找不到数据,这样是不行的。所以今天所谓的智能一定是要全线打通的。
今天是数据智能的时代,我们所看到的智能化都是大数据在驱动的。机器学习的重点就是深度学习。其实神经网络和机器学习并不是一个新概念,今天与以前所不一样的在于深度。核心的能力其实是计算能力的增长。你的层数越多意味着你要学习的参数越多,参数与你要训练数据的规模是有关的。数据不够,模型大了的话就会缺乏扩展性。今天机器学习能够快速进展就是因为有数据。阿里在背后花了很多的时间做并行的训练,核心的过程是我们需要数据的滚动过程,不断地收集数据、训练模型、优化结果。
本文根据阿里巴巴iDST自然语言服务部总监初敏博士在2016云栖大会成都峰会演讲整理。