打字猴:1.700540116e+09

1700540116

1700540117 分析与解答

1700540118

1700540119

1700540120 传统概率生成模型要定义一个概率分布表达式P(X)，通常是一个多变量联合概率分布的密度函数，并基于此做最大似然估计。这过程少不了概率推断计算，比如计算边缘概率P(Xi)、条件概率P(Xi|Xj)以及作分母的Partition Function等。当随机变量很多时，概率模型会变得十分复杂，概率计算变得非常困难，即使做近似计算，效果常不尽人意。GANs在刻画概率生成模型时，并不对概率密度函数p(X)直接建模，而是通过制造样本x，间接体现出分布p(X)，就是说我们看不到p(X)的一个表达式。那么怎么做呢？

1700540121

1700540122

1700540123

1700540124 如果随机变量Z和X之间满足某种映射关系X=f(Z)，那么它们的概率分布pX(X)和pZ(Z)也存在某种映射关系。当都是一维随机变量时，；当Z,X是高维随机变量时，导数变成雅克比矩阵，即pX=JpZ。因此，已知Z的分布，我们对随机变量间的转换函数f直接建模，就唯一确定了X的分布。

1700540125

1700540126 这样，不仅避开大量复杂的概率计算，而且给f更大的发挥空间，我们可以用神经网络来训练f。近些年神经网络领域大踏步向前发展，涌现出一批新技术来优化网络结构，除了经典的卷积神经网络和循环神经网络，还有ReLu激活函数、批量归一化、Dropout等，都可以自由地添加到生成器的网络中，大大增强生成器的表达能力。

1700540127

1700540128 问题4　GANs在实际训练中会遇到什么问题？

1700540129

1700540130 难度：★★★★☆

1700540131

1700540132