1700538490
图9.14是卷积神经网络的一个经典结构示意图。这是LeCun Yann在1998年提出的卷积神经网络结构,输入在经历几次卷积和池化层的重复操作之后,接入几个全连通层并输出预测结果,已成功应用于手写体识别任务。
1700538491
1700538492
1700538493
1700538494
1700538495
图9.14 LeNet卷积神经网络
1700538496
1700538497
知识点
1700538498
1700538499
图像处理,深度学习,自然语言处理
1700538500
1700538501
问题1 卷积操作的本质特性包括稀疏交互和参数共享,具体解释这两种特性及其作用。
1700538502
1700538503
难度:★★☆☆☆
1700538504
1700538505
分析与解答
1700538506
1700538507
■ 稀疏交互(Sparse Interaction)
1700538508
1700538509
在传统神经网络中,网络层之间输入与输出的连接关系可以由一个权值参数矩阵来表示,其中每个单独的参数值都表示了前后层某两个神经元节点之间的交互。对于全连接网络,任意一对输入与输出神经元之间都产生交互,形成稠密的连接结构,如图9.15所示,神经元si与输入的所有神经元xj均有连接。
1700538510
1700538511
1700538512
1700538513
1700538514
图9.15 全连接层结构示意图
1700538515
1700538516
而在卷积神经网络中,卷积核尺度远小于输入的维度,这样每个输出神经元仅与前一层特定局部区域内的神经元存在连接权重(即产生交互),我们称这种特性为稀疏交互,如图9.16所示。可以看到与稠密的连接结构不同,神经元si仅与前一层中的xi−1、xi和xi+1相连。具体来讲,假设网络中相邻两层分别具有m个输入和n个输出,全连接网络中的权值参数矩阵将包含m×n个参数。对于稀疏交互的卷积网络,如果限定每个输出与前一层神经元的连接数为k,那么该层的参数总量为k×n。在实际应用中,一般k值远小于m就可以取得较为可观的效果;而此时优化过程的时间复杂度将会减小几个数量级,过拟合的情况也得到了较好的改善。
1700538517
1700538518
1700538519
1700538520
1700538521
图9.16 卷积层结构示意图
1700538522
1700538523
稀疏交互的物理意义是,通常图像、文本、语音等现实世界中的数据都具有局部的特征结构,我们可以先学习局部的特征,再将局部的特征组合起来形成更复杂和抽象的特征。以人脸识别为例,最底层的神经元可以检测出各个角度的边缘特征(见图9.17(a));位于中间层的神经元可以将边缘组合起来得到眼睛、鼻子、嘴巴等复杂特征(见图9.17(b));最后,位于上层的神经元可以根据各个器官的组合检测出人脸的特征(见图9.17(c))。
1700538524
1700538525
1700538526
1700538527
1700538528
图9.17 人脸识别中不同卷积层的可视化
1700538529
1700538530
■ 参数共享(Parameter Sharing)
1700538531
1700538532
参数共享是指在同一个模型的不同模块中使用相同的参数,它是卷积运算的固有属性。全连接网络中,计算每层的输出时,权值参数矩阵中的每个元素只作用于某个输入元素一次;而在卷积神经网络中,卷积核中的每一个元素将作用于每一次局部输入的特定位置上。根据参数共享的思想,我们只需要学习一组参数集合,而不需要针对每个位置的每个参数都进行优化,从而大大降低了模型的存储需求。
1700538533
1700538534
参数共享的物理意义是使得卷积层具有平移等变性。假如图像中有一只猫,那么无论它出现在图像中的任何位置,我们都应该将它识别为猫,也就是说神经网络的输出对于平移变换来说应当是等变的。特别地,当函数f (x)与g(x)满足f (g(x))=g( f (x))时,我们称f (x)关于变换g具有等变性。将g视为输入的任意平移函数,令I表示输入图像(在整数坐标上的灰度值函数),平移变换后得到I’=g(I)。例如,我们把猫的图像向右移动l像素,满足I’(x,y)=I(x−l,y)。我们令f表示卷积函数,根据其性质,我们很容易得到g( f(I))=f (I’)=f (g(I ))。也就是说,在猫的图片上先进行卷积,再向右平移l像素的输出,与先将图片向右平移l像素再进行卷积操作的输出结果是相等的。
1700538535
1700538536
问题2 常用的池化操作有哪些?池化的作用是什么?
1700538537
1700538538
难度:★★★☆☆
1700538539
[
上一页 ]
[ :1.70053849e+09 ]
[
下一页 ]