大约2500年前,一个美索不达米亚的商人使用陶器、木制品和簧片作为流通货币,这改变了人类经济的发展历史。后来,美索不达米亚的商人又使用“算盘”来记录的他们商品,调整财政政策,这促成了经济的蓬勃发展。
在这些灵感乍现的时候恰恰折射出了人类具有惊人的能力:能够整合现有的概念,并构想出一些全新的概念。许多不为人知的发明家曾不得不考虑他们想要解决的问题是什么,可能制造出怎样的装置以及要思考建立这些装置所需要的原材料是什么,例如,粘土可以通过模具压成平板,簧片可以充当计数器。这些物体都具有相似性、但又是独特的,但是如果以某种全新的方式将它们融合在一起,它们就可能形成一些革命性的东西。
“组合性”的思想在人类的创造力、想象力和基于语言的沟通等能力中处于核心的位置。有了少量的基本概念,人类能够创造出大量全新的概念——我们从具体到一般的示例中,以新颖的方式重组层次结构的不同部分,很自然地做到这一点。
但是,人类如此自然就能做到的事情,对于人工智能却是一个挑战。
而在谷歌子公司DeepMind的最新论文中,他们提出了一个新的理论来解决这个问题:一种新的神经网络——符号-概念关联网络——能够通过模仿人类的视觉和文字的获取方式来学习基于视觉的概念层次,并能够想象出由语言指令诱导的新概念。
概念层次(Concept Hierarchy)是指将大量的概念用层次化的方法组织起来,使得子概念所包含的意义比原先更加特殊,但又可以被其父概念所概括。
DeepMind的方法归纳如下:
符号-概念关联网络模型的视觉世界可能与几个月大的婴儿体验的视觉世界相同。在刚出生的前几个月里,婴儿的眼睛不能够集中观察超过手臂长度的物体,这段时间里,婴儿基本上是通过移动和旋转眼前的物体,观察进入视线中的对象。
为了模拟这个过程,DeepMind实验室模拟的三维世界使用了该模型,在这里,它就像在床上的婴儿一样,床不能移动,但是能够通过旋转并观察到在不同颜色背景下的三个不同物体(帽子,手提箱或冰棍)之一。像婴儿的视觉系统一样,该模型学到了视觉世界的基本结构以及如何用可解释的视觉“元素”表示不同的对象。例如,当观察一颗苹果时,该模型将学会如何用颜色、形状、大小、位置和光强度来表示它。
一旦我们的模型能够根据可解释的视觉元素来理解世界,我们就进入了学习过程的命名阶段——这相当于婴儿的单词学习阶段,在这个阶段,成年人开始为不同的视觉对象提供符号性的词汇标签。例如,在这个阶段,父母可能会指着一颗苹果对孩子说:“这是一颗‘苹果’”。与这个过程相似,在基本的语言输入下,符号-概念关联网络的视觉体验会被增强,所以,一张描绘有“黄色墙壁上悬挂着一个红色手提箱”的图像,可以标签化为“红色手提箱,黄色墙壁”。
符号-概念关联网络在前一阶段学到的视觉元素的基础上进一步学习新概念的意义。例如,一个苹果的概念可能是以其颜色、形状和大小来指定,与此同时,其他的视觉元素如位置、光照强度则应被正确地识别出来与苹果的概念无关。
这个命名过程可以用于学习概念层次中的视觉概念,也可以使用同样的过程教模型理解“and”、“ignore”,“in common”等概念重组操作符的意义,重要的是,这只需要少量的样例即可达到目标。l例如,可以给符号-概念关联网络输入一张标有符号指令“golden delicious IS yellow AND apple”的“golden delicious”苹果的图片,它就可能学会“and”的意义。
一旦符号-概念关联网络学会了词汇的概念,学会了通过符号指令操纵它们的方式,开发者就可以通过口头指令使其将熟悉的概念重组成新概念,而不需要更多的图片作为输入样例。
通过这些指令,符号-概念关联网络可以想象出大量新颖的视觉概念,如苹果的颜色(“蓝色苹果”意味着“蓝色”和“苹果”两种属性)或苹果的种类。
图丨符号-概念关联网络通过语言指令遍历概念层次,从像“红色地板的蓝色房间有一个白色手提箱”这样的具体概念到更一般的概念“手提箱”,然后再回到一个更加具体的概念“一个有粉色地板的黄色房间有一个绿色手提箱”。在每一次遍历过程中,都要求符号-概念关联网络想象对应的概念。最后,开发人员要求符号-概念关联网络理解“西装”这个词的概念,虽然它从来没有见过西装,但是它却能够想象出西装的大致样子。
这项工作不同于先前的工作: 这项工作完全基于感官数据并能够从极少的样例(图片-单词对)中学习。深度学习虽然能学习概念,但需要成千上万张图片样例。
符号-概念关联网络主要从无监督的观察中学习视觉元素和抽象的概念;对于标签化的数据,仅仅需要5个样例就可能学会一个概念。一旦训练完成,该网络能够产生与特定图像相对应的不同概念,也能够想象与特定概念相对应的对象,即使之前它并没有接触过这些概念。
图丨符号-概念关联网络想象的“白色手提箱”的可能样子;右图:从“橙色地板的粉色房间中有一个青色帽子”的图像中产生的概念。
利用符号指令,重组已有概念并形成新概念的能力使机器能够理解像“宇宙”、“人文主义”、“经济学”这样的抽象概念,这是一种惊人的能力。尽管DeepMind的算法还有很长一段路要走,但是这项工作很大程度上证明了算法能够以无监督的方式学习,并能够思考类似于人类使用的那些抽象概念。
原文发布时间为:2017-09-13
本文来自云栖社区合作伙伴极市网,了解相关信息可以关注极市网。