打字猴:1.700539987e+09
1700539987 百面机器学习:算法工程师带你去面试 [:1700532246]
1700539988 百面机器学习:算法工程师带你去面试 01 初识GANs的秘密
1700539989
1700539990
1700539991
1700539992 场景描述
1700539993
1700539994 2014年来自加拿大蒙特利尔大学的年轻博士生Ian Goodfellow和他的导师Yoshua Bengio提出一个叫GANs的模型[32]。Facebook AI实验室主任Yann LeCun称该模型是机器学习领域近十年最具创意的想法。把GANs想象成造假币者与警察间展开的一场猫捉老鼠游戏,造假币者试图造出以假乱真的假币,警察试图发现这些假币,对抗使二者的水平都得到提高。从造假币到合成模拟图片,道理是一样的。下面关于GANs,从基础理论到具体模型,再到实验设计,我们依次思考如下几个问题。
1700539995
1700539996 知识点
1700539997
1700539998 MiniMax游戏,值函数(Value Function),JS距离(Jensen- Shannon Divergence),概率生成模型,优化饱和
1700539999
1700540000 问题1 简述GANs的基本思想和训练过程。
1700540001
1700540002 难度:★☆☆☆☆
1700540003
1700540004 分析与解答
1700540005
1700540006 GANs的主要框架如图13.1所示,包括生成器(Generator)和判别器(Discriminator)两个部分。其中,生成器用于合成“假”样本,判别器用于判断输入的样本是真实的还是合成的。具体来说,生成器从先验分布中采得随机信号,经过神经网络的变换,得到模拟样本;判别器既接收来自生成器的模拟样本,也接收来自实际数据集的真实样本,但我们并不告诉判别器样本来源,需要它自己判断。生成器和判别器是一对“冤家”,置身于对抗环境中,生成器尽可能造出样本迷惑判别器,而判别器则尽可能识别出来自生成器的样本。然而,对抗不是目的,在对抗中让双方能力各有所长才是目的。理想情况下,生成器和判别器最终能达到一种平衡,双方都臻于完美,彼此都没有更进一步的空间。
1700540007
1700540008
1700540009
1700540010
1700540011 图13.1 GANs模型的框架图
1700540012
1700540013 GANs采用对抗策略进行模型训练,一方面,生成器通过调节自身参数,使得其生成的样本尽量难以被判别器识别出是真实样本还是模拟样本;另一方面,判别器通过调节自身参数,使得其能尽可能准确地判别出输入样本的来源。具体训练时,采用生成器和判别器交替优化的方式。
1700540014
1700540015 (1)在训练判别器时,先固定生成器G(·);然后利用生成器随机模拟产生样本G(z)作为负样本(z是一个随机向量),并从真实数据集中采样获得正样本X;将这些正负样本输入到判别器D(·)中,根据判别器的输出(即D(X)或D(G(z)))和样本标签来计算误差;最后利用误差反向传播算法来更新判别器D(·)的参数,如图13.2所示。
1700540016
1700540017
1700540018
1700540019
1700540020 图13.2 GANs中判别器的训练
1700540021
1700540022 (2)在训练生成器时,先固定判别器D(·);然后利用当前生成器G(·)随机模拟产生样本G(z),并输入到判别器D(·)中;根据判别器的输出D(G(z))和样本标签来计算误差,最后利用误差反向传播算法来更新生成器G(·)的参数,如图13.3所示。
1700540023
1700540024
1700540025
1700540026
1700540027 图13.3 GANs中生成器的训练
1700540028
1700540029 问题2 GANs的值函数。
1700540030
1700540031 难度:★★★☆☆
1700540032
1700540033 GANs是一个双人MiniMax游戏,请给出游戏的值函数。理想情况下游戏最终会达到一个纳什均衡点,此时记生成器为G*,判别器为D*,请给出此时的解(G*,D*),以及对应的值函数的取值。在未达到均衡点时,将生成器G固定,寻找当下最优的判别器DG*,请给出DG*和此时的值函数。上述问题的答案在Goodfellow的论文中都有回答,进一步地,倘若固定D而将G优化到底,那么解GD*和此时的值函数又揭示出什么呢?
1700540034
1700540035 分析与解答
1700540036
[ 上一页 ]  [ :1.700539987e+09 ]  [ 下一页 ]