1700540142
(13.7)
1700540143
1700540144
因此训练G的梯度为
1700540145
1700540146
1700540147
1700540148
1700540149
(13.8)
1700540150
1700540151
1700540152
1700540153
当D很容易认出模拟样本时,意味着认错模拟样本的概率几乎为零,即。假定,C为一个常量,则可推出
1700540154
1700540155
1700540156
1700540157
1700540158
1700540159
1700540160
1700540161
(13.9)
1700540162
1700540163
故G获得的梯度基本为零,这说明D强大后对G的帮助反而微乎其微。
1700540164
1700540165
1700540166
1700540167
怎么办呢?解决方案是将变为,形式上有一个负号的差别,故让后者最大等效于让前者最小,二者在最优时解相同。我们看看更改后的目标函数有什么样的梯度:
1700540168
1700540169
1700540170
1700540171
1700540172
(13.10)
1700540173
1700540174
1700540175
1700540176
1700540177
(13.11)
1700540178
1700540179
1700540180
1700540181
即使趋于零,也不会消失,仍能给生成器提供有效的梯度。
1700540182
1700540183
1700540184
1700540185
1700540187
百面机器学习:算法工程师带你去面试 02 WGAN:抓住低维的幽灵
1700540188
1700540189
1700540190
1700540191
场景描述
[
上一页 ]
[ :1.700540142e+09 ]
[
下一页 ]