打字猴:1.700540486e+09

1700540486

1700540487 （13.20）

1700540488

1700540489

1700540490 其中分别为生成网络、推断网络和判别网络的参数，判别网络试图最大化V函数，生成和推断网络则试图最小化V函数。第一个等号右边的式子，反映了在重参数化技巧（Re-parameterization Trick）下将三个网络组装成一个大网络；第二个等号右边的式子，从判别器的角度看产生(x,z)的两个不同数据源。

1700540491

1700540492

1700540493

1700540494

1700540495 图13.16　ALI模型

1700540496

1700540497

1700540498

1700540499 实际中，为克服训练初期生成和推断网络从判别网络获取梯度不足的问题，我们采用一个梯度增强版的优化目标，将原目标函数中的改成。原GANs论文指出，这个小变换不改变前后优化目标的解，但是前者会出现梯度饱和问题，后者能产生更明显的梯度。修改前生成和推断网络的优化目标为：

1700540500

1700540501

1700540502 ．

1700540503

1700540504 （13.21）

1700540505

1700540506 修改后的优化目标为：

1700540507

1700540508

1700540509 ．

1700540510

1700540511 （13.22）

1700540512

1700540513 有了上面的分析，就好设计出一个同时训练生成和推断网络及判别网络的GANs算法。

1700540514

1700540515

1700540516

1700540517

1700540518 百面机器学习：算法工程师带你去面试 [:1700532250]

1700540519 百面机器学习：算法工程师带你去面试 05　IRGAN: 生成离散样本

1700540520

1700540521

1700540522

1700540523 场景描述

1700540524

1700540525 Reddit论坛上有一篇Goodfellow发表的帖子：“GANs have not been applied to NLP because GANs are only defined for real-valued data… The gradient of the output of the discriminator network with respect to the synthetic data tells you how to slightly change the synthetic data to make it more realistic. You can make slight changes to the synthetic data if it is based on continuous numbers. If it is based on discrete numbers，there is no way to make a slight change.”

1700540526

1700540527 大意是说，最初设计GANs是用来生成实值数据的，生成器输出一个实数向量。这样，判别器对实数向量每维都产生一个梯度，用作对模型参数的微小更新，持续的微小更新使得量变引起质变，最终达到一个非常好的解。可是，如果生成器输出离散数据，诸如：搜索引擎返回的链接，电商网站推荐的手机，那么梯度产生的微小更新就被打破了，因为离散样本的变化不是连续而是跳跃的。举个例子，灯光亮度是一种连续型数据，可以说把灯光调亮一些，也可以说把灯光调亮一点，还可以说把灯光调亮一点点，这都可操作；但是，从买苹果转到买橙子，你不能说买橙子一些，一点或者一点点（见图13.17）。将GANs用来生成离散数据，不是一件简单的事情，但是生活中很多时候，我们遇到的就是各型各色的离散型数据。

1700540528

1700540529

1700540530

1700540531

1700540532 图13.17　离散数据

1700540533

1700540534 让我们想象一个信息检索的场景：给定一个查询词，系统返回与查询词相关的若干文档。现在，我们有一批用户点击数据，记录用户在某查询词下点击哪些文档。用户的反馈告诉我们哪些是正样本，为了训练识别正负样本的有监督模型，我们还需负样本，即与查询词不相关或者看似相关实则无关的样本。通常做法是在全部文档集上随机负采样，一个查询词的正样本集与全体文档集比简直沧海一粟，所以随机采得的文档碰巧是正样本的概率很小。但这会遇到一个问题，随机负采样的结果往往太简单，对模型构不成难度。我们想尽量制造易混淆的例子，才能让模型的学习能力达到一个新水平。因此，我们不能在全集做负采样，必须在与查询词含义接近或貌似接近的地带负采样。一个新问题是，这种有偏采样下，采到正样本的概率大大增加，我们不能简单地认为随机采样结果都是负样本。怎么办呢？2017年的一篇论文提出了解决办法，称之为IRGAN[41]。

1700540535

[ 上一页 ] [ :1.700540486e+09 ] [ 下一页 ]