中国人工智能学会通讯——最优传输理论在机器学习中的应用 1.2 概率分布逼近-阿里云开发者社区

中国人工智能学会通讯——最优传输理论在机器学习中的应用 1.2 概率分布逼近

2017-09-01 2436

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

1.2 概率分布逼近

深度学习的方法强劲有力，几乎横扫计算机视觉的所有领域，很多人将其归功于神经网络的万有逼近能力（universal approximation property）：给定一个连续函数或者映射，理论上可以用一个包含足够多神经元的隐层 , 或者多层前馈网络逼近到任意精度。对此，我们提出另外的观点：有些情况下，神经网络逼近的不是函数或映射，而是概率分布；更为重要的，逼近概率分布比逼近映射要容易得多。更为精密的说法如下：在理想情况下，即逼近误差为零的情形，如果神经网络逼近一个映射，那么解空间只包含一个映射；如果神经网络逼近一个概率分布，那么解空间包含无穷多个映射，这些映射的差别构成一个无穷维李群。这是我们更为看好逼近概率分布，而非逼近映射的原因之一。

1. 概率生成模型

首先看最简单的（伪）随机数生成器。我们选取适当的整数 a、b 、m ，计算序列

这个最优传输映射是某个凸函数的梯度映射，这个凸函数被称为是 Brenier 势能函数，满足蒙日-安培方程。如图 14 所示，我们将怪兽曲面（第一帧和第四帧）保角地映射到平面圆盘上面（第二帧），保角映射将曲面的面积元映射到平面上，诱导了平面圆盘上的一个概率测度。平面圆盘上也有均匀概率分布（第三帧），从第二帧到第三帧的映射为最优传输映射。图 14 和 15 显示了基于最优传输映射的曲面保面积参数化（Surface Area-preserving Parameterization）。

2. 映射极分解理论

3. 小结

通过以上讨论，我们看到如果用一个深度学习的网络来逼近一个映射，解空间只有一个映射；如果来逼近一个概率分布，则解空间为无穷维的保体积微分同胚群。因此，用深度学习网络来逼近一个概率分布要比逼近一个映射函或者数容易得多。这或许可以用来解释如下的现象：基于我们以往的经验，用神经网络来求解非线性偏微分方程，要比用神经网络做图像分类困难，因为前者需要精确逼近泛函空间中的可逆映射，而后者需要逼近图像空间中的概率分布。

中国人工智能学会通讯——最优传输理论在机器学习中的应用 1.2 概率分布逼近

1.2 概率分布逼近

1. 概率生成模型

2. 映射极分解理论

3. 小结

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

中国人工智能学会通讯——最优传输理论在机器学习中的应用 1.2 概率分布逼近

1.2 概率分布逼近

1. 概率生成模型

2. 映射极分解理论

3. 小结

热门文章

最新文章

相关课程

相关电子书

相关实验场景