Amazon.com公司以往似乎并不像谷歌、微软、Facebook以及IBM那样在人工智能领域引人注目,但这一情况如今开始出现改观。
Amazon公司首席执行官Jeff Bezos最近发布了年度股东信,并在信中表示他认为作为AI领域的一大分支,机器学习这种能够无需编程即可实现计算机学习的技术将成为该公司未来发展的关键所在。
具体来讲,与目前的其它AI领导厂商一样,Amazon公司专注于打造深度学习神经网络,旨在以原始方式模拟大脑工作原理。深度学习在过去几年中立足语音与图像识别领域取得了巨大进步,而这一切也最终使得Amazon Alexa语音助手及谷歌自动驾驶车辆等方案成为可能。
Bezos同时指出,Amazon方面将利用机器学习支持Alexa、Prime Air送货无人机以及Amazon Go商店。其它机器学习方案则将继续提供幕后技术,包括进行供电需求预测、产品改进建议等等。Bezos希望这项新型技术能够最大程度为人类提供便利。
“关注这一领域”
Amazon公司的下一阶段目标在于利用Amazon Web Services云提供更为低廉的成本与易用效果,从而将机器学习成果交付至广大开发者手中。Amazon公司于去年秋季通过自家云环境中的Lex等一系列新服务面向开发者尝试机器学习能力交付,希望借此提供更为便携的交互界面——例如通过Polly服务将文本转换为语音,或通过Rekognition实现图像分析与关联。
Bezos指出,“客户们已经开发出多种强大的系统方案,其功能涵盖从早期疾病检测到提升农作物产量等多个领域。”
这位Amazon公司创始人不仅是在追求最新发展潮流。事实上,机器学习服务亦能够帮助Amazon在日益升温的云计算市场竞争中占据优势地位,特别是考虑到谷歌与微软在云业务领域的快速崛起。很明显,Amazon公司希望成为未来智能应用时代下的主要技术供应商。
CB Insights公司在最新报道中表示,“Amazon很可能会将AI作为下一大与其会员免费发货服务及AWS等同的业务支柱。Amazon公司正以前所未有的势头发展成一家平台厂商。”
通过对Gartner等市场分析企业结论的解读,Amazon找到了在云机器学习产品领域赶超微软与谷歌的有效途径。在上周于旧金山召开的AWS峰会上,该公司公布了一系列更新与全新功能,旨在快速缩小自身在AI领域与竞争对手间的差距。
为了更为深入地了解Amazon公司的机器学习规划,我们与Amazon AWS AI副总裁Swami Sivasubramanian进行了交流。以下为相关对话内容(经过编辑与调整):
问:您能否谈谈Amazon公司目前在机器学习领域的工作范畴?
答:具体可以分为三大层面。Lex、Polly与Rekognition等高级应用属于经过预先训练的深度学习模型,其通过应用程序编辑接口为那些不打算亲自涉足机器学习,但又希望开发出具备听取、朗读或者观察能力的智能应用程序的开发者们提供相关功能。
下一个层面则为Amazon Machine Learning等API平台服务以及EMR(即Elastic MapReduce,用于分析大规模数据)等相关组成部分,其适用于那些乐于利用Redshift(AWS数据仓库)或者其它关系数据库数据自行构建机器学习模型的用户。而我们团队的下一项目标则为开发深度学习框架与机器学习算法。
目前团队中有一大批科学家正在研究核心深度学习框架。在AWS公司,我们采取非常开放的心态并支持一切深度学习框架,具体包括Apache MXNet、TensorFlow乃至Caffe与Theano等等。
Amazon公司AWS AI事务负责人Swami Subramanian
问:总体来讲,您希望在这一领域达成怎样的目标?
答:我们的目标基本上是实现人工智能民主化,意味着每位开发人员皆可以访问AI功能。一般来讲,即使立足于当下,开发人工智能方案通常也需要开发者拥有博士学位。
我们希望能够构建起新型智能应用程序,并真正造福于人类,例如确保其能够看到、听到、说出或者理解我们的表达。另外,我们也致力于帮助企业及其业务部门立足于存储在AWS当中的数据作出更为明智的商业决策。
问:为了实现这一目标,您已经采取了哪些行动?
答:Netflix公司已经利用深度学习建立起一套推荐引擎,用以向客户推荐其可能感兴趣的内容。Pinterest公司则打造出图像识别方案。我们在Amazon当中利用机器学习技术支持物流机制,因此当您点击购买某商品的按钮时,机器人将利用计算机视觉与深度学习技术以了解您所选择并应当发货的商品。我们还利用这类技术增强现有产品——举例来说,我们将计算机视觉与深度学习引入Amazon即时视频功能X-Ray当中,意味着用户在暂停当前画面时,其能够帮助您识别出每一位出现在画面中的演员。
我们还利用它创建新的产品系列。现在大家对于Alexa应该不再陌生。我们与Alexa进行了两年的对话交流,就像是面对真人一样对其加以训练。而在Amazon Go商店方面,凭借着视觉识别技术,我们能够看到顾客拿起及放下商品的动作,从而提供零结帐购物体验。
问:Amazon公司最近一直在强调AI业务,但在这方面谷歌、微软、Facebook等企业的表现似乎更加引人注目。您是否在努力改变这一现状?
答:在Amazon,我们只关注真正关乎客户利益的事项。以Amazon Go为例,我们希望提供零结帐销售体验以帮助客户更高效地完成购物。在这方面,我们并不会刻意将其与AI技术联系起来。Alexa也是一样。虽然我是一位科学家,但我更喜欢谈体验而非技术,毕竟我的家人确实很喜欢跟Alexa交流。
具体来讲,Amazon公司多年来一直在机器学习与人工智能方面投入巨资,我们也在以相当开放的方式与科学界共享我们的贡献。我们今年又提交了多篇研究论文。在MXnet,我们的代码贡献量占其中的35%。
问:作为一项已经存在20年甚至更长的技术,为什么近年来深度学习算法迎来了快速发展?
答:主要原因有三。其一,我们现在有能力以低廉的成本存储全部数据,而无需向存储方案供应商支付巨额资金。第二,拥有专业计算方案。GPU(图形处理单元)与FPGA(现场可编程门阵列)芯片有效加速了此类应用的执行速度。最后,一旦建立并训练出相关模型,我们即可通过预配置的模板轻松将分布式训练基础设施扩展到数百个GPU当中。凭借着云计算的资源优势,现在大家能够充分享受相关编程的便捷优势。
未来展望
问:Amazon在以怎样的比例关注现有技术应用与新型算法或技术的构建?
答:我们在多个领域进行基础性创新研究,具体包括语音识别、自然语言理解以及视觉识别。如果将时间退回到十年前,我们必须持续推动深度学习技术的边界才能为客户交付拥有实际价值的准确性结果。在这一过程当中,我们不断发明新的算法,以确保Alexa等服务能够提供与预期相符的客户体验——或者像在Amazon Go项目当中,大幅提高深度学习与计算机视觉识别能力以将设想变为现实。
我们亦在核心引擎领域进行着基础性研究,包括开发各类深度学习框架。我们拥有一支专门的深度学习引擎开发团队,他们负责努力扩展相关系统。客户目前希望处理的图像、视频等数据问题经常达到PB级别,随着待处理数据量的不断增加,可扩展性也将成为未来几年内各厂商所提供之解决方案的主要差异之一。
问:您的机器学习模型能够在云网络的边缘位置起效——例如当无法接入中央云环境时,支持自动驾驶车辆顺利运行?
答:我们认为,面向云环境构建的模式也应当能够在边缘位置运行。我们构建的深度学习模型能够在传统计算机环境下运行,亦可对接EC2(AWS弹性计算云服务)或者Lambda(AWS专用计算服务)。Greengrass(一款软件,能够在无需云服务的条件下实现数据的离线操作与本地处理)可将边缘设备作为良好的运行环境。我们的团队还移植了一款MXNet深度学习模型,其可以识别表中的对象,且能够运行于Raspberry Pi摄像头(一款小型低成本计算设备)内。
我们的目标是建立一整套混合体,其中部分深度学习模型立足边缘位置运行以支持快速使用情况,另一部分则运行在云环境中以支持更为复杂的用例。Alexa采取的正是这种设计方式。也正因为如此,我们认为这种新的混合部署模式将在未来拥有强大的生命力。
问:机器学习的未来发展方向是什么?
答:我儿女今年两岁了,她只需要看过两枚西红柿,就能了解西红柿究竟是什么样子——而不像机器学习那样需要比较上千个西红柿才能完成学习。正因为如此,我清醒地意识到深度学习目前还处于起步阶段。实际上,目前的多种现有技术已经能够利用非常有限的数据提升深度学习模型的分析准确性。
我们一直在进行相关尝试。有时候人们并不需要太高的准确性。好使是对于视觉搜索这样的方案,人们往往也更倾向于选择更大的覆盖面,且愿意为此牺牲一部分精度。
因此还有更多的任务等待我们完成。如果将Amazon的机器学习研究视为完整的一天,那么我们目前身处的阶段仅仅是刚刚醒来——甚至还没有喝下早餐咖啡。