开发者学堂课程【阿里小蜜中的机器阅读技术:背景介绍】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/43/detail/962
背景介绍
内容介绍:
一、分享简介
二、双十一背后的神秘部队
一、分享简介
本次分享主要包含这几个方面,首先会介绍机器阅读理解的技术背景,其次回顾机器阅读理解的学术研究现状,第3部分会具体分析从学术到工业的挑战与解法,最后再分享此项技术可能的未来方向。
二、双十一背后的神秘部队
每年的天猫双11都是阿里巴巴的商业盛典。在2018年,天猫双11创造了2,135亿的成交总额,产生了11个包裹,是一场消费者的购物狂欢节,而在这场狂欢的背后,购物服务的顺滑体验也不可忽视。
作为双11背后的服务主力,阿里小蜜的整个智能服务占比达到了98%,因而成为了满足阿里主要的官方服务渠道,其98%的服务量相当于10万名客服连续24小时的工作量,并且在这些承接的服务中阿里小蜜解决了其中95%的服务,同时阿里店小蜜作为帮助商家服务消费者的智能店铺助理,双11当天对话的轮次达到了3.5亿,等同于58.6万名人工客服24小时的工作量。
由此可见随着技术的变革,使得以前这种大规模需要去线性增长的服务变成了一种弹性可伸缩,有技术、有智能来驱动的一项服务。
如下图,在双11整个的业务环节中,一个比较典型的问答场景是:众所周知在双11消费者最关注的就是购物津贴和一些活动相关的信息。那么在当天大量的咨询都会关注于这些具体的津贴优惠的一个叠加或领取的方式,因而有一些用户可能问“为什么我不能去参加活动?定金还能不能参加满减?活动今天是不是还在持续?领到的优惠券在哪里能够看到?”
在传统的思路中要去完成或去支持如上的问答,一般需要通过一个知识库,因为一般的问答机器人是依赖于一个人工编辑的知识库。
从原始的活动的规则描述里面,知识库的运营人员需要把这些描述拆解成一条一条的F1Q,再把这个 F1Q 录入到知识库中,然后此时机器人可以借助这些 F1Q 去与用户的问题做一些匹配来返回最终的答案。
在此过程中,首先存在的问题就是长篇幅的活动的文章拆解较困难,而拆解往往又依赖于小二自己以往的维护经验,比如说拆解力度是应该粗一点还是细一点,如果拆解的太粗,用户的体感会很差,因为可能打开购物屏面全都是相关的一个介绍,抓不住重点,而拆解太细,往往需要的人工更多,而且会特别的细碎,同时一般这种活动时效性比较短、更新业务比较繁琐,相对来说为了仅仅支持一天这样的活动,前期投入大量的人去做一些知识点拆解,其性价比或投入产出比并不是特别高。
如下可通过机器直接阅读文章从里面找答案:
通过算法的能力直接阅读相关的活动规则、在线实时回复用户的问题,将规则中相关与问题最确切的那部分答案抓取出来,然后突出,展示在小蜜的页面里,在这个过程中可以减少人工阅读,拆解、配置工作的工作量,同时也可以自动的根据用户的问题理解相关的问法来灵活选取答案的内容,如上也就是阅读的一个定义,它能够去解析一些无结构或者是半结构化的一些长文档,从文档里面根据用户的问题来摘取适合的内容。