GAN和蒙日-安培方程理论
最近老顾收到很多读者来信,绝大多数询问对抗生成网络的最优传输解释,以及和蒙日-安培方程的关系。很多问题涉及到经典蒙日-安培方程理论,这里我们从偏微分方程和几何角度介绍一下蒙日-安培方程的理论,主要是解的存在性,性。我们尽量用较为初等的方式来解释。
和最优传输
深度学习的巨大成功可以归结为自然数据所满足如下两个定则:1)流形分布律:同类自然数据满足特定的概率分布,可以用概率分布来刻画,其支集是高维数据背景空间中的低维流形;2)聚类分布律:同一数据中的不同子类表示成不同的概率分布;并且这些概率分布之间的距离足够远,使得这些子类可以被区分。因此,深度学习的核心任务包括:1)学习流形结构:即计算从流形到参数域的参数化映射(编码、解码映射);也计算流形之间的映射;2)概率分布变换:在特征空间或者图像空间中,计算两种概率分布之间的距离,和两种概率分布之间的变换。
基于最优传输观点,特别是几何上的Alexandrov途径,我们设计了新颖的生成模型,进行了初步试验。这里的几何可以用硬件加速。详细的讨论请见深度学习和几何(演讲提要)。下面,我们用尽量初等的方法来介绍蒙日-安培方程弱解的存在性和性。
凸函数
图1. 左帧非凸集,右帧凸集。
证明基于下面事实:正定矩阵之和、正定矩阵和正常数的数乘还是正定矩阵;或者用第一个定义。
图3. 凸函数的次微分。
图4. 勒让德变换。
图5. 由支撑平面重构凸函数。
蒙日-安培测度
蒙日-安培测度具有非常直观而且重要的特性。
不等式成立。
图6. 次微分的单调性。
蒙日-安培方程
我们可以得到迪利克雷问题弱解的稳定性如下:
图7. 锥函数。
最优传输映射和蒙日-安培方程
小结
对抗生成模型(GAN model)可以用最优传输理论来解释和计算,生成器等价于求解最优传输映射,判别器等价于计算Wasserstein距离,即最优传输映射的传输总代价。传输代价的Brenier理论将最优传输映射求解归结为蒙日-安培方程的弱解。这里我们用尽量初等的方法介绍了蒙日-安培方程弱解(Alexandrov 解)的存在性和性,由此帮助大家奠定学习GAN模型的理论基础。
除了理论严密清晰,白箱替代黑箱,从深度学习的实战角度而言,用蒙日-安培方程的几何解法计算最优传输映射来部分替代目前深度生成模型方法,具有很多优点:
蒙日-安培方程的几何解法归结为凸优化问题,保证最优解的存在性和性,不会停留在局部最优上面;
蒙日-安培方程的几何解法具有明确的海森矩阵,可以用牛顿法进行优化,二阶收敛。或者用超线性的拟牛顿法,效率远高于线性的梯度下降法。
蒙日-安培方程几何解法的误差可以较精确控制,采样密度和逼近Brenier势能函数的误差模有确定关系,可以自适应条件采样密度,以提高逼近精度。
算法设计具有层级(hirearchical)和自适应(self adaptive)特性,进一步提高效率。
蒙日-安培方程的几何解法硬件友好,可以用目前的GPU并行实现。
实验结果验证了我们的看法,用这种方法从效率和生成质量而言,优于传统方法。
蒙日-安培方程的正则性理论更加复杂,但是对于模式塌缩的理解非常关键。我们会在未来加以详尽讨论。
声明:文章收集于网络,为传播信息而发,如有侵权,请联系小编及时处理,谢谢!
时间:2019-02-27 22:42 来源: 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
相关推荐:
网友评论:
最新文章
热门文章