为理解自然语言,唯有慢慢的填坑。
上周,以先进的机器学习和自然语言处理技术见长的聊天机器人初创公司Talla推出了一款HR机器人。而就在近日,其首席执行官ROB MAY在某科技网站撰文,指出了一些聊天机器人在自然语言处理上面临的问题,并表示,虽然自然语言处理技术能够改善用户体验,但依旧面临着各种技术挑战。
以下是正文:
目前诸如Slack以及HipChat等聊天机器人的应用逐步增多,企业都在使用聊天机器人发挥更多功能。不少应用程序开发商都在试图抢占这个新的风口,特别是不断加强对自然语言处理技术的研究,从而寄希望于通过该技术提升用户体验。
对于自然语言处理技术,我们已经投入很多精力来改进、来提升相关的用户体验。自然语言处理技术是一个新兴的研究领域,尽管我们拥有一个强大的数据科学研究团队,但对于该技术的研发还处于初始阶段。目前来看,自然语言处理技术依旧不够成熟,也不够完善,相关的工程实例根本谈不上良好的用户体验。
不久前,我们推出了具备自然语言处理功能的聊天机器人Task Assistant,超过700家公司使用了该产品,产生了不少相关教训:
1、人类语言极为不同
即便是关于简单任务,人类与聊天机器人之间的交互也各有不同。在用户语言中,充斥着各式各样的夸张、隐喻、文字拼写错误以及俚语,这些语言组织方式的存在使得聊天机器人需要大量的训练。
Facebook语言技术开发团队工程总监艾伦·帕克(Alan Packer)曾就如何构建机器翻译技术进行过深入探讨。虽然工作语言并不像用户的日常用语一样多样化,我们可以通过所提供聊天机器人的类型对不同工作进行区分,从而对机器所能理解的语言加以限制。虽然自然语言处理技术仍非易事,但是通过针对不同工作用户进行相应调整,能够有效减少机器理解歧义引发的相关问题。
2、聊天机器人不能将所有不理解转嫁给背后的人类客服
很多聊天机器人的背后都有人类干预,当机器无法理解用户语言时,它们将相关问题转给人类处理。这种处理问题的想法是通过这种方式训练聊天机器人,直至其存储了足够多的数据以应对各种问题。但当用户期望获得更好的用户体验,并期望机器能够完全理解其意思时,这并不是一个可持续性的解决方法。因为当用户提出一个独一无二的问题时,机器无法进行扩展。据统计,目前15%的谷歌搜索都是独一无二的,这意味着每天都有上亿次的独特查询。对于聊天机器人来说,要回答所有的人类问题时相当困难的,因此单单依靠背后的人类客服并不是长久之计。
第一点已经不用多说了,毕竟在这一点上,多数人都已有了自己的认识,而关键的第二点却一针见血的说出了当前的一个盲点所在。的确,按照当前的方法,聊天机器人也只是一个会模仿的提线木偶而已,并不能真正的理解自然语言,而这样就代表着一切努力终将是白费力气。
不过,在当前针对自然理解语言面临的问题上,ROB还能够提出这与众不同的一点,如此新颖奇特,也难怪他的公司在机器学习与自然语言处理上能达到如此成就。