1700538621
1700538622
为了解释梯度消失问题是如何产生的。回顾第3节推导出的误差传播公式
1700538623
1700538624
1700538625
1700538626
1700538627
(9.43)
1700538628
1700538629
将式(9.31)再展开一层,可以得到
1700538630
1700538631
1700538632
1700538633
1700538634
(9.44)
1700538635
1700538636
1700538637
1700538638
1700538639
1700538640
1700538641
1700538642
可以看到误差传播可以写成参数、以及导数、连乘的形式。当误差由第L层(记为)传播到除输入以外的第一个隐含层(记为)的时候,会涉及非常多的参数和导数的连乘,这时误差很容易产生消失或者膨胀,影响对该层参数的正确学习。因此深度神经网络的拟合和泛化能力较差,有时甚至不如浅层的神经网络模型精度更高。
1700538643
1700538644
1700538645
1700538646
ResNet通过调整网络结构来解决上述问题。首先考虑两层神经网络的简单叠加(见图9.23(a)),这时输入x经过两个网络层的变换得到H(x),激活函数采用ReLU。反向传播时,梯度将涉及两层参数的交叉相乘,可能会在离输入近的网络层中产生梯度消失的现象。ResNet把网络结构调整为,既然离输入近的神经网络层较难训练,那么我们可以将它短接到更靠近输出的层,如图9.23(b)所示。输入x经过两个神经网络的变换得到F(x),同时也短接到两层之后,最后这个包含两层的神经网络模块输出H(x)=F(x)+x。这样一来,F(x)被设计为只需要拟合输入x与目标输出的残差,残差网络的名称也因此而来。如果某一层的输出已经较好的拟合了期望结果,那么多加入一层不会使得模型变得更差,因为该层的输出将直接被短接到两层之后,相当于直接学习了一个恒等映射,而跳过的两层只需要拟合上层输出和目标之间的残差即可。
1700538647
1700538648
1700538649
1700538650
1700538651
图9.23 ResNet结构示意图
1700538652
1700538653
ResNet可以有效改善深层的神经网络学习问题,使得训练更深的网络成为可能,如图9.24所示。图9.24(a)展示的是传统神经网络的结果,可以看到随着模型结构的加深训练误差反而上升;而图9.24(b)是ResNet的实验结果,随着模型结构的加深,训练误差逐渐降低,并且优于相同层数的传统的神经网络。
1700538654
1700538655
1700538656
1700538657
1700538658
图9.24 ResNet网络与传统网络的效果对比
1700538659
1700538660
逸闻趣事
1700538661
1700538662
1700538663
1700538664
Geoffrey Hinton的传奇人生
1700538665
1700538666
深度学习泰斗 Geoffrey Hinton 的名字在当今的人工智能研究界可谓是如雷贯耳,他曾发明了玻尔兹曼机,也首先将反向传播应用于多层神经网络。不仅如此,他还有 Yann LeCun 和 Ilya Sutskever 等大牛级的学生。
1700538667
1700538668
Hinton 教授出生于英国的温布尔登。他的母亲是一位数学老师,父亲是一个专注甲壳虫研究的昆虫学家。“国民生产总值”这个术语,是他的舅舅、经济学家Colin Clark发明的。他的高曾祖父是 19 世纪的逻辑学家 George Boole —— 现代计算科学的基础布尔代数的发明人。后来,他们家搬到了布里斯托,Hinton进入了克里夫顿学院,这所学校在他口中是个“二流公立学校”。正是在这里,他结识的一个朋友给他讲了全息图,讲了人脑如何存储记忆,为他打开了AI的神奇大门。
1700538669
1700538670
高中毕业后,Hinton去剑桥大学学习物理学和化学,但只读了 1 个月就退学了。一年后,他又重新申请剑桥大学并转学建筑,结果又退学了,这次他只坚持了 1 天。然后转向物理学和生理学,但是后来发现物理学中的数学太难了,因此转学哲学,花 1 年修完了 2 年的课程。Hinton 说:“这一年大有裨益,因为我对哲学产生了强烈的抗体,我想要理解人类意识的工作原理。”为此,他转向了心理学,仅仅为了确定“心理学家对人类意识也不明所以”。在 1973 年前往爱丁堡大学研究生院学习人工智能之前,他做了 1 年的木匠。他在爱丁堡大学的导师是 Christopher Longuet-Higgins,其学生包括多伦多大学化学家、诺贝尔奖得主 John Polanyi 和理论物理学家 Peter Higgs。
[
上一页 ]
[ :1.700538621e+09 ]
[
下一页 ]