2019年7月21日,SIGIR 2019 在巴黎开幕。SIGIR是展示信息检索领域新技术和新成果的顶级国际会议。今年支付宝共有多篇论文入选,围绕智能客服、文本动态检索等课题,向行业分享自身沉淀的AI信息检索技术应用成果。
随着数字技术的发展,数字化生活渗透在日常的方方面面。数字世界越来越海量的信息,需要有不断更新的技术和方法来处理,提升服务效率,让更多价值被发现。
本文将重点介绍本次支付宝入选的论文成果精华。
未卜先知:利用强化学习预测用户意图
早在2017年,支付宝智能客服实现了“未问先答”的功能,就是用户还没开口问,智能客服系统就能“猜”中问题,并给出回复,仿佛有未卜先知的能力。
据介绍,用户意图预测是智能客服系统的重要组成部分,其本质是基于用户的历史行为与状态来预测用户可能碰到的问题,并向用户呈现候选问题供其选择,从而提升用户体验。这样的用户意图预测任务可以被视为一个top-N推荐任务。过去,一个典型的解决方案是找到用户最感兴趣的候选问题,通常忽略问题之间的相互关系,旨在优化例如点击之类的直接奖励。
而在本次会议被收录的文章“ReinforcementLearning for User Intent Prediction in Customer Service Bots”中,支付宝AI工程师把用户意图预测建模为N步序列决策过程并利用强化学习(RL)来找出最佳推荐策略。在每个步骤中,支付宝工程师基于RL模型找到要添加到推荐列表的合适问题,同时让策略可以随着问题流行度和用户行为模式的变化而不断更新和调整,更好地捕捉推荐问题间的相互关系,提升用户体验。
复杂问题即时回答:提出无监督学习优化方法QUEST
而智能客户服务的另一个场景——基于文本的问答,系统面临的挑战则在于需要在包含多实体和关系的情况下直接应答。这个问题在需要解决基于多文档应答的情况下尤为显著。基于知识图谱的问答系统可能会给出较好的答案,但仍会受限于图谱固有的不完整性和延时性。
在论文“Answering Complex Questionsby Joining Multi-Document Evidence with Quasi Knowledge Graphs”中,支付宝AI工程师提出了QUEST,一种能够基于即时文本来源,通过计算不同文档的部分结果相似性直接回答复杂问题的方法。QUEST用节点和带权重的边构建了一个带噪声的类知识图谱,其由动态检索的实体名称和关系短语组成。这个类知识图谱又用实体类型和语义对齐进行了扩充,然后用Group Steiner Tree算法计算最佳答案。这种方法是无监督的,不存在训练数据瓶颈,从而能够应对在用户问题当中快速变化的特定主题和表达风格。QUEST在处理复杂问题时的实验效果远超目前的最优基线系统。