打字猴:1.70054031e+09
1700540310
1700540311 图13.8 WGAN的训练
1700540312
1700540313
1700540314
1700540315
1700540316 百面机器学习:算法工程师带你去面试 [:1700532248]
1700540317 百面机器学习:算法工程师带你去面试 03 DCGAN:当GANs遇上卷积
1700540318
1700540319
1700540320
1700540321 场景描述
1700540322
1700540323 虽然GANs一开始用于图像生成,但是没有马上应用卷积神经网络。通常提到图像,人们会想到卷积神经网络,为什么GANs最初时没有用它呢?原来不是随便一个卷积神经网络就能玩转GANs,研究者最初的尝试不怎么成功。
1700540324
1700540325 图像相关的几大学习任务包括:图像分类、图像分割、物体检测与识别等。
1700540326
1700540327 图像分类任务是大多数卷积神经网络的主战场,从手写数字识别到ImageNet大规模图像识别比赛,从AlexNet、VGG、GoogLeNet到ResNet,遍布着各类卷积神经网络结构。输入一张图片,输出一个类别,一端是密密麻麻的像素点阵,一端是表示类别的一个词,从输入端到输出端丢失大量信息,比如识别狗的图片,模型关心的是狗,不是狗的大小、颜色和品种,如图13.9所示。信息的丢失使得卷积神经网络仅用来识别图片类别,难以输出一张高分辨率的图片。
1700540328
1700540329
1700540330
1700540331
1700540332 图13.9 图像分类
1700540333
1700540334 图像分割任务中,输入一张图片,输出与原图同尺寸的分割图,图片被切成不同区域,同区域的点用同一颜色表示。输入端还是一张图,输出端信息量相比分类任务是有所增加了。注意,传统卷积神经网络中每层的高宽越来越小,丢失大量与像素位置相关的信息,为了进行图像分割任务,研究者们提出了一些新的卷积神经网络结构,比如分数步进卷积层(Fractional-Strided Convolutions),也称反卷积层(Deconvolutions),它让每层的高宽不减反增,从而使得分割任务中最终的输出和原始输入图片尺寸相同,如图13.10所示。
1700540335
1700540336
1700540337
1700540338
1700540339 图13.10 图像分割
1700540340
1700540341 但是,图像生成不是图像分割(见图13.11)。图像分割的输出端虽然与原图同尺寸,但是像素级别的细节信息依然大量丢掉,难以生成高分辨率的图片。图像生成这点事,绝不是信手拈来一个卷积神经网络就能搞定。我们该怎么改进卷积神经网络呢?
1700540342
1700540343
1700540344
1700540345
1700540346 图13.11 图像生成
1700540347
1700540348 知识点
1700540349
1700540350 卷积神经网络,分数步进卷积层(反卷积层),批量归一化,ReLU/LReLU
1700540351
1700540352 问题 在生成器和判别器中应该怎样设计深层卷积结构?
1700540353
1700540354 难度:★★★☆☆
1700540355
1700540356 为了生成高分辨率的优质图片,我们准备在GANs框架内嵌入多层卷积网络。但是,一般的卷积结构达不到我们的期待。
1700540357
1700540358 分析与解答
1700540359
[ 上一页 ]  [ :1.70054031e+09 ]  [ 下一页 ]