从下图来看“神经网络”时代的到来似乎很可怕。
那么,上图的可怕场景又是如何开始的呢?
生成对抗网络的进步
什么是生成对抗网络呢?如果把经过深入研究的神经网络(如图像分类器)看作是神经网络技术的左半球。这样来看就很容易理解什么是生成对抗网络了。生成对抗网络相当于是神经网络技术的右半球——并且它是具有创造力的。
生成对抗网络(GANs)是神经网络技术学习创造力的第一步。典型的GAN是一种基于特定的主题,利用图像数据集和随机噪声作为种子来生成图像的神经网络。到目前为止,GANs生成图像的质量较低,分辨率也有限。NVIDIA公司最近的研究成果表明,GAN能够在高分辨率下生成逼真的图像,并以开放访问的方式发布了这项技术。
上图为GAN图像的例子,有些很逼真的,有些不太逼真。
带条件约束的GANs和变分自编码器
众多的GANs类型对应拥有各种各样的复杂性、体系结构和奇怪的缩写词,但这里我们主要讨论带条件约束的GANs和变分自编码器。带条件约束的GANs不仅能够模仿生成“卧室”、“脸”、“狗”等广泛类型的图像,而且能够深入地模仿生成更加具体类别的图像。例如,Text2图像网络能够将关于图像的文本描述翻译成图像。
通过改变与“含义”向量相连的随机种子,能够产生无数鸟类图像,并且图像与描述匹配。
机会
闭上眼睛,想象2年后的世界。NVIDIA等公司会把GAN技术推向行业成熟水平,就像他们对待名人面孔一样。这意味着,GAN将能够根据文本描述生成任意图像,并且能够按需生成、动态生成。这也将会导致许多摄影和设计相关的行业过时,下面是GAN技术的工作原理。
同样,GAN能够通过改变随机种子产生无数图像。
个性化
这是比较可怕的一部分,GAN不仅可以通过目标对象的描述来生成图像,还可以通过用户活动目录的向量来生成图像。活动目录能够深入地描述用户的个性、网页浏览历史、最近的交易和地理位置,所以GAN生成图像具有一次性、独特性且符合用户喜好。正因如此,网络的点击率才会暴增。
通过测试用户的反应,GAN将做出改变并使推送给用户的广告更符合其喜好,直击用户弱点。
泡沫趋势
因此,在一天结束的时候,我们在互联网上随处可见的是完全个性化的内容。
每个用户看到的是包含所有内容的完全自定义版本,自定义版本是根据用户的生活方式、观点和历史记录改编的。最近的美国大选之后,我们看到了这种泡沫模式的觉醒,所以个性化情况会越来越严重。GANs能够为用户精确地定位内容,而不受媒介的限制——从图像广告到复杂的观点、想法和出版物,这些都是由机器设备生成的。这将形成一个持续的反馈循环,并根据用户的交互进行改进。而且不同的GAN之间会有竞争,这是一场以人类为战场、完全自动化的战争。可想而知,利润是这一趋势背后的推动力。
这不是可怕的世界末日场景,这样的场景实际上发生在今天。
这是好事还是坏事?
我也不知道。但是能够确定的是,公众对于GAN技术的广泛讨论是不可避免的,我们需要制定后备计划阻止舆论。所以现在需要考虑的是——我们该如何应对公众的讨论并从中获益。
技术方面的问题
由于技术的限制,我们还没有到上面所述的地步。直到最近,GAN生成图像的质量还是比较差,且图像易被发现是假的。NVIDIA 公司表示,GAN实际可以生成分辨率为1024x1024且非常逼真的人脸图像。为了推动GAN技术的发展,我们需要更快更大的图形处理器、更多关于GAN的理论研究、更多关于GAN训练的好方法、更多标记数据集等。
但是请注意,我们不需要新的电源、量子处理器(有一定帮助)、可生成逼真图像的一般人工智能以及其他纯理论的新事物。大公司可能已经拥有了上述资源,所以我们所需要的只是几年时间。
此外,我们还需要更智能的神经网络。我正在寻找关于Hinton等人所研究的神经元组方法的突破。我们在超分辨率技术中首次使用了神经元组方法,当然这也得益于GAN的进步。
本文由阿里云云栖社区组织翻译。
文章原标题《the-new-neural-internet-is-coming》
作者: Oleksandr Savsunenko 译者:吴兆青,审校:袁虎。
文章为简译,更为详细的内容,请查看原文文章。