复旦博士给机器人当语言老师,教出了英语四级水平的“阿里小蜜“

简介: 海外生活十五载,这位全美律师都离不开的复旦博士,回国第一份工作,是进阿里做客服小二。

十五年前,Peter从复旦大学计算机系博士毕业,主修自然语言处理和机器学习。彼时,国内人工智能尚未起步,他便在英国工作。

在这期间,Peter为“LexisNeixs”公司研究出了一套智能案件搜索系统,在法律届广泛应用,至今仍是全美律师最离不开的掌中宝。

Peter是上海人,一张周正的国字脸上,驾着一副黑框眼镜,身上透着浓浓的精英范。来阿里之前,Peter在毕马威会计事务所,负责研究人工智能客服,“当时全公司只有我懂这个(基于人工智能的客服机器人)。”

谁也想不到,2017年3月,这个复旦博士回国做的第一件事,是加入阿里巴巴集团(以下简称“阿里”),成为了阿里人工智能客服——“阿里小蜜”的语言老师。

“在阿里,服务体量广,业务场景多,人工智能有更多的发挥空间,我的工作也更有价值。”Peter说。

全美律师离不开的复旦博士

15年前,国内的人工智能研究环境尚未起步,Peter毕业后,只能出国工作。在英国,Peter投身于“lexis advance”的智能检索项目的研究。现在这个产品已经成为全美地区律师的工作法宝。

“别看只是案件检索,事实上可远不是只搜个标题那么简单”。Peter解释道。在案件判定中,影响最后裁定的因素往往非常多,而当律师拿到一个案件时往往需要通过检索尽量相似的案件做参照。

通过“lexis advance”,一个新的案例输入后系统会自动分析相关要点并检索出最匹配的的案例用于参照,帮助律师让诉讼准备更精准、更高效。时至今日,该体系仍是全美律师必不可少的工作助手。

后来,Peter作为三星的产品经理研发出了智能语音助手——S-voice,至今仍在三星Galaxy手机上中服务全球数百万用户。

加入阿里,服务全球用户

2014年以前,作为全球最大的电商平台,阿里每天需要面对逾4亿的活跃消费者、上千万的商家和每天几千万笔的交易。在淘宝、天猫,每天有近5万次热线电话求助,无线电每天的服务量更是超过100万次。

“人力过度依赖”的客服系统下,一个投诉单,可能需要几天才能得到反馈,势必影响用户体验。

2014年,阿里巴巴将各业务线客服工作,整合成阿里巴巴集团客户体验事业群(简称CCO线)。

彼时的Peter,正在英国,作为首席数据科学家为“毕马威”研发人工智能客服,重点服务于企业内部,让一些重复性的问题由机器来承载。

但会计事务所的咨询体量不大,涉及面也受限,让他颇有“英雄无用武之地”之感。

2017年3月,阿里人工智能客服“阿里小蜜”正式上线投入应用。在国内应运而生。

这是阿里巴巴自主研发的新一代人工智能客服机器人,目前已经在淘宝天猫等数十个业务中投入应用,功能包括但不限于解答客户咨询、查物流、做导购、交话费、订机票、讲段子。

a27c76c40f291fef4dcb0377bf8a9d97d5366853

当阿里服务团队向他伸出橄榄枝时,这位复旦博士心动了,摇身一变成为“阿里小蜜”的语言老师,通过机器人服务世界各地的“剁手党”。

光退款,就得教几千种说法

这个语言老师,当得并不轻松。不单是因为淘宝业务复杂,中文的博大精深和人类情感的交融才是真正的挑战。

比如对于咨询量很高的“退款”问题,在语言表达上就有上千种说法。面对需要退款的商品,“剁手党”们并不会中规中矩地询问“如何退款”,而是带着一定的情绪向“小蜜”投诉:

“我新买的衣服是破的…”

“我的鞋子不合尺码…”

“这件大衣并不是百分百的双面羊绒…”

“这个鞋子并不防水,我在哈尔滨穿不了…”

这些投诉里没有提及“退款”,但都蕴含着“退款”的诉求。

面对海量的表达方式,Peter和他的团队就需要搜集足各种可能的咨询方式,梳理各种情况,建立语言模型,将之输入“小蜜”的语言体系中,使其从客户的各种各样的故事中推导出客户背后的核心诉求。

当然,除了正儿八经地咨询,“剁手党”当中,也不乏找“小蜜”闲聊的。

而此时,这个复旦博士最担心的就是,“‘小蜜’把天聊死。”

为了更好地服务客户,Peter团队为“小蜜”接入了海量的素材库,博闻强识。但素材体量太大,团队无法一一审核,偶尔会出现一些“乌龙”。

机器不像人,会有价值取向和性格。在素材库搜索答案时,“小蜜”基于一些别人的恶搞设计便给出了肯定的答案。当团队发现这个对话时,哭笑不得,立即对知识库进行梳理。

 “小蜜”英文水平已达四级,

每天服务数百万用户

短短半年时间,在Peter和团队的教导下,“小蜜”不仅中文突飞猛进,能基于上下文多轮对话精准的分析用户诉求,英文能力也进步迅速,已经成长为一个有四级英文水平的“青年”。

就在前不久,小蜜已经在马来西亚、新加坡两个国家全量上线,3月底,预计将在调过、印尼等更多东南亚国家上线,服务当地英文用户。

现在,“小蜜”每天在服务的全球剁手党超350万。在2017年的“双11”当天,“阿里小蜜”更是承担了95%的客服咨询,除了原有的咨询、导购、催发货查物流等等基础功能,还能全面解答双11预售规则、红包、下单、支付等热点问题。

未来,Peter还希望将“小蜜”培养成一个贴心、专业的私人导购助理。

当女生们选择恐惧症发作,不知道选择哪支口红,哪个粉底时,“小蜜”能够根据用户自身的特指和消费习惯,为其精准推荐更加适合的产品。

又或者,当男生面对五花八门的3C犹豫不决时,“小蜜”也能给出合理的建议。甚至可以根据用户的爱好和使用习惯推荐出性价比最高的数码产品。

从研发出全美律师案件检索系统的“四大行精英”到如今的“语言老师”,Peter觉得自己肩上的责任更加重了。因为“阿里小蜜”的服务对象,是每天数以百万计,来自全球的人。

d64ed4ff3da5f7fe79f929cc789b221b6fdb141a

“很有趣,很有挑战性,每天做的工作都不一样”。Peter兴致勃勃地说。


原文发布时间为:2018-01-16

本文作者:郑璐瑶

本文来自云栖社区合作伙伴“天下网商”,了解相关信息可以关注“天下网商”微信公众号

相关文章
|
3月前
|
自然语言处理 机器人 API
【Azure 机器人】微软Azure Bot 编辑器系列(4) : 使用语言生成功能[LG: Language Generation] (The Bot Framework Composer tutorials)
【Azure 机器人】微软Azure Bot 编辑器系列(4) : 使用语言生成功能[LG: Language Generation] (The Bot Framework Composer tutorials)
|
机器学习/深度学习 存储 机器人
一文看懂!Go语言开发聊天机器人
一文看懂!Go语言开发聊天机器人
132 0
|
6月前
|
人工智能 机器人 芯片
英伟达最强 AI 芯片、人形机器人模型炸场!黄仁勋放言英语将成最强大编程语言
在2024年的GTC大会上,英伟达创始人黄仁勋揭幕了新一代AI芯片Blackwell,号称是史上最强AI芯片,目标是推动AI领域的重大进步。
|
机器学习/深度学习 人工智能 自然语言处理
谷歌机器人「吃了」语言大模型后,会自学和思考了
谷歌机器人「吃了」语言大模型后,会自学和思考了
270 0
|
机器学习/深度学习 数据采集 自然语言处理
谷歌机器人迈入「交互语言」新纪元!开放命令正确率高达93.5%,开源数据量提升十倍
谷歌机器人迈入「交互语言」新纪元!开放命令正确率高达93.5%,开源数据量提升十倍
128 0
|
人工智能 机器人
为什么聊天机器人不会在语言密集型角色中完全取代人类
在这篇博文中,我们讨论了在客户服务和写作行业中使用聊天机器人的利弊。虽然聊天机器人能够对客户查询提供快速准确的响应,但它们缺乏人类作家和客户服务代表所拥有的创造力、同理心和真实性。我们还将讨论围绕聊天机器人和人工智能的一般使用的道德问题。总的来说,聊天机器人应该被视为一种补充,而不是人类劳动的替代品。在这篇文章中详细了解聊天机器人在劳动力中的作用。 我理解许多人对人工智能取代人类工人的潜力的担忧。具体来说,人们一直在猜测聊天机器人有可能取代人类客户服务代表、作家和其他依赖语言技能的专业人士。
94 0
|
自然语言处理 机器人
|
机器学习/深度学习 安全 机器人
Google X华人博士发布机器人模拟器SimGAN,ICLR2021已发表!
深度学习都能模拟现实了?通过观察机器人的运行轨迹,连摩擦系数都能学出来!Google X的一位斯坦福华人博士最近在ICLR2021上发表了一篇文章,教你动态模拟现实!
160 0
Google X华人博士发布机器人模拟器SimGAN,ICLR2021已发表!
|
机器学习/深度学习 传感器 人工智能
哥伦比亚华人博士推出「蓝脸」机器人,会做42种表情!ICRA 2021已发表
给机器人赋予情感一直是AI工程师在做的事,最近哥伦比亚华人博士研究了一个能做6种情绪、42种表情的机器人,脸是蓝色的,看起来十分炫酷。相关工作已在ICRA 2021上发表。
158 0
哥伦比亚华人博士推出「蓝脸」机器人,会做42种表情!ICRA 2021已发表
|
人工智能 达摩院 算法
阿里达摩院:以语音为代表的人机交互或许是未来硬件和机器人的标配
【摘要】语音和多模态人机交互会是以机器人为代表的智能硬件的必备特征, 实践中首先要克服的是声学环境的复杂性。在声学前端核心技术上, 深挖信号处理的在线自适应能力, 以及经典信号处理与任务模型的联合优化是我们的技术特色, 也因此在高噪声、高性价比等实际业务场景都创造了多项业内第一。声学模组和芯片化也是克服场景碎片化的有效手段, 也因此快速合作落地了一批智能硬件产品, 赢得了客户的口碑,为端侧计算能力的平台化, 探索了有生命力的路径。
352 0
阿里达摩院:以语音为代表的人机交互或许是未来硬件和机器人的标配
下一篇
无影云桌面