ALI的Tensorflow炼成与GAN科普

简介:

Abstract:Deep Learning是一个很大的领域,其中GAN是Deep Learning的明星,希望大家可以通过本文来简单的了解一下GAN这个模型以及这个模型的一些运用。本文介绍关于GAN的一些知识以及GAN的思想如何转移到ALI中,以及通过Google的Deep Learning框架TensorFlow,通过MNIST数据来实现ALI模型。所涉及到Tensorflow的一些很简单的一些解说,包括tf.Variable()和tf.placeholder()的一些用法以及区别,同时给出一小段代码案例。虽然提到了最简单的两个Tensorflow,tf.Variable()和tf.placeholder(),但是在本文中,不深入解释更多的关于TensorFlow的运用以及神经网络是如何搭建的。最后,我们将结果组合成模型。

使用Tensorflow建立ALI模型

背景
由于这次做项目的时候用到ALI这个Model,朋友希望自己能够为ALI和GAN来写一点自己的想法,故作此文。

生成模型已经成为建复杂高维数据集模型的常用的框架,面对复杂性时如同降维二向箔打击。

什么是ALI模型?
ALI(adversarially learned inference),中文直译过来呢,就是对抗学习推理了吧?

在这里简单的给大家介绍一下ALI模型。既然有一个Adversarial在里面,那想必就和GAN有一点关系了。而GAN(Generative Adversarial Networks)即“生成对抗网络”就是Deep Learning入门神书的作者Ian Goodfellow的神作。

GAN的idea就是同时训练两个模型,一个生成模型,一个Discriminative Model。我们把生成模型简写成G,Discriminative Model简称为D。而实现的方法,是让两个网络相互竞争。

生成模型是用来获取数据的分布情况的,而D则是用来估计来自训练数据的概率的。生成模型的训练过程就是想办法把D的错误概率给最大化。在任意函数G和D的空间中,存在唯一的解决方案,G恢复训练数据分布,D等于1/2。在G和D由多层感知器定义的情况下,整个系统可以用BP来进行训练。

在Training或Generating样本的期间,不需要任何马尔科夫链或展开的近似推理网络。,也就是活生生的把推理给绕过去了。当然还有Autoregressive Approaches(自回归方法)放弃潜在的表征,而是直接对输入变量之间的关系进行建模。或多或少的砍掉或者放弃掉一些东西。

自回归模型可以生成相当出色的样本,但是牺牲掉了速度。同时其要求学习之前数据的抽象表达。而基于GAN的方法代表了一个很好的妥协:他们学习一个生成模型,生成比最佳VAE技术更高质量的样本,而不牺牲采样速度,并且还利用潜在代表在生成过程中。然而,GAN缺乏有效的推理机制,使得GANs无法在抽象层面推理数据。因此大牛们在研究如何优雅的将GANs其他的方法进行结合,出杂交种,其实本质意义上就是在两个短板中互相妥协罢了。

ALI是个通过Generation Network和Inference Network。 两个Model来对怼。也就是将Inference Machine(或encoder)和深度定向G Model(decoder)投入到类似GAN的对抗框架中学习。

训练一个鉴别器,以便将来自解码器的联合样本的数据和相应的潜在变量的联合样本与编码器(或近似后验)区分开,而编码器和解码器被一起训练以愚弄鉴别器。我们不仅要求鉴别器区分合成样本与实际数据,而且要求它区分数据空间和潜在变量之间的两个联合分布。生成网络将样本从随机潜在变量映射到数据空间,而推理网络将数据空间中的训练示例映射到潜在变量的空间。

ALI概念图


我们可以针对GAN得出以下构想:

两个一个生成器,一个判别器共两个神经网络重复博弈。

今天用Tensorflow实现一下,同时解释一些Tensorflow的Concept


在这里,我们设置好我们的参数。


导入大名鼎鼎的MNIST数据


一个简单的科普

很多人其实经常就是Tensorflow的第一步就愣住了,卧槽???这是什么玩意???为了让大家不至于——“卧槽这是什么玩意?”简单的给大家说一下tf.placeholder:

其实大家看模型的时候(包括看Keras或者TensorLayer),其实经常可以看到两个很经典东西:

tf.Variable()

tf.placeholder()

这两个有什么区别呢?

为了训练我们的example,我们首先要立个placeholder。tf.placeholder是用来feed我们需要训练的example的,同时tf.placeholder是必须用feed_dict来fed!!!

给大家举个例子:


在这里呢,sess.run(y_example)是会被弄死的,因为你只能用feed_dict来fed我们的tf.placeholder,但是我们对比一下tf.Variable的话,tf.Variable是通过run()调用来维护状态的,也就是说,在之前的我们的sess.run(y_example)是可以受用于tf.Variable的。

通过构造tf.Variable来向图中添加变量。同时tf.Variable()的构造函数需要给定任何类型和形状的Tensor变量的初始值。初始值定义变量的类型和形状,其变量的type和shape是固定的。因此,在这里我们主要使用tf.placeholder来feed我们需要训练的example的。

OK,现在进入正题


先定义几个简单的小函数,包括一些必要的log和sample的函数以及后期用到的导出结果的可视化函数。

由于这一环节没有任何的难点,不做多余阐述:



在这里解释一下Q、P、D三个函数: 
Q函数,将

现在我们通过tf.Session()来跑模型。最后,说一下这个很经常出现Session()。Tensorflow以Graph的计算而得名,而Session()封装了执行Operation对象的环境。通过Session可以执行图的计算。与Session相近的有tf.InteractiveSession() 
tf.InteractiveSession()将自己安装为构建中的默认Session。而简单直接的方法也有这般:

常规会话会在with语句中创建时将其自身作为默认会话。一般我们在代码中的用法是这样的,我也比较常用Session()这个方法就是了:


总结一下一般的启动逻辑:


因此,tensorflow就将底层给配置好之后,我们在tensorflow这个大环境里愉快的奔跑。而难点就在于Variable的各种的设置和run的操作方法。初期,Variable被大量的套路给设定好,我们可以通过别人的轮子,来配适。

但是Deep Learning的从业者的核心价值应该在于能够自己的将自己想做的数据导入自己的模型,而不是简单的调参或者利用别人的轮子滚来滚去。各种算法和一些主流的实现就像加减乘除一般了然于胸,并且有自己做轮子的能力。


将模型训练十万次(如果有想法的,请换一台支持GPU的电脑,要不然可能会等很久。),我们将1000Iteration为一个单位,print一次:


由于导出大量的图片,我在这里就给大家看一下对比图, 
最早的图:

不久之后:


本文由ALI Paper, arxiv依照Tensorflow重现。ALI的概念非本人提出,本人根据自己对ALI的理解通过Tensorflow进行实现,并且运行于Jupyter中。所有代码在Windows10,Python3.5,TensorflowGPU版(1.1.0rc2)完美运行。限于本人水平,可能有出现一定的错误,如有失误,欢迎交流。同时,由于本人学习Deep Learning的时候直接接触英文材料,故一些专有名词的翻译可能存在一些偏差。故一些专有名词直接保留为原单词,不做翻译。ALI的翻译没有参考过任何相关中文信息,由本人直接查阅在Arxiv上ALI的原文所得。如果有想来交流的小伙伴,欢迎私信。 
Reference

1、ALI Paper, arxiv
2、GAN - Paper, NIPS
3、GAN - Goodfellow
4、生成模型与判别模型 zouxy09,csdn
5、Adversarial machine learning - ACM Digital Library
Running Graph


原文发布时间为:2017-05-15 
本文作者:那只猫
本文来自云栖社区合作伙伴“ Python中文社区”,了解相关信息可以关注“ Python中文社区”微信公众号
相关文章
|
5月前
|
机器学习/深度学习 API 算法框架/工具
【Tensorflow+keras】Keras API两种训练GAN网络的方式
使用Keras API以两种不同方式训练条件生成对抗网络(CGAN)的示例代码:一种是使用train_on_batch方法,另一种是使用tf.GradientTape进行自定义训练循环。
59 5
|
机器学习/深度学习 TensorFlow 算法框架/工具
TensorFlow实现GAN生成对抗网络生成MNIST图像
TensorFlow实现GAN生成对抗网络生成MNIST图像
182 0
|
1月前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
287 55
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
TensorFlow,一款由谷歌开发的开源深度学习框架,详细讲解了使用 TensorFlow 构建深度学习模型的步骤
本文介绍了 TensorFlow,一款由谷歌开发的开源深度学习框架,详细讲解了使用 TensorFlow 构建深度学习模型的步骤,包括数据准备、模型定义、损失函数与优化器选择、模型训练与评估、模型保存与部署,并展示了构建全连接神经网络的具体示例。此外,还探讨了 TensorFlow 的高级特性,如自动微分、模型可视化和分布式训练,以及其在未来的发展前景。
195 5
|
2月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
108 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
2月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
135 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
136 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
基于TensorFlow的深度学习模型训练与优化实战
基于TensorFlow的深度学习模型训练与优化实战
126 0
|
2月前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
111 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型

热门文章

最新文章