1700535527
百面机器学习:算法工程师带你去面试 03 自组织映射神经网络
1700535528
1700535529
1700535530
1700535531
场景描述
1700535532
1700535533
自组织映射神经网络(Self-Organizing Map,SOM)是无监督学习方法中一类重要方法,可以用作聚类、高维可视化、数据压缩、特征提取等多种用途。在深度神经网络大为流行的今天,谈及自组织映射神经网络依然是一件非常有意义的事情,这主要是由于自组织映射神经网络融入了大量人脑神经元的信号处理机制,有着独特的结构特点。该模型由芬兰赫尔辛基大学教授Teuvo Kohonen于1981年提出,因此也被称为Kohonen网络。
1700535534
1700535535
知识点
1700535536
1700535537
自组织映射神经网络
1700535538
1700535539
问题1 自组织映射神经网络是如何工作的?它与K均值算法有何区别?
1700535540
1700535541
难度:★★★☆☆
1700535542
1700535543
分析与解答
1700535544
1700535545
生物学研究表明,在人脑的感知通道上,神经元组织是有序排列的;同时,大脑皮层会对外界特定时空信息的输入在特定区域产生兴奋,而且相类似的外界信息输入产生对应兴奋的大脑皮层区域也连续映像的。例如,生物视网膜中有许多特定的细胞对特定的图形比较敏感,当视网膜中有若干个接收单元同时受特定模式刺激时,就使大脑皮层中的特定神经元开始兴奋,且输入模式接近时与之对应的兴奋神经元也接近;在听觉通道上,神经元在结构排列上与频率的关系十分密切,对于某个频率,特定的神经元具有最大的响应,位置相邻的神经元具有相近的频率特征,而远离的神经元具有的频率特征差别也较大。大脑皮层中神经元的这种响应特点不是先天安排好的,而是通过后天的学习自组织形成的。
1700535546
1700535547
在生物神经系统中,还存在着一种侧抑制现象,即一个神经细胞兴奋后,会对周围其他神经细胞产生抑制作用。这种抑制作用会使神经细胞之间出现竞争,其结果是某些获胜,而另一些则失败。表现形式是获胜神经细胞兴奋,失败神经细胞抑制。自组织神经网络就是对上述生物神经系统功能的一种人工神经网络模拟。
1700535548
1700535549
自组织映射神经网络本质上是一个两层的神经网络,包含输入层和输出层(竞争层)。输入层模拟感知外界输入信息的视网膜,输出层模拟做出响应的大脑皮层。输出层中神经元的个数通常是聚类的个数,代表每一个需要聚成的类。训练时采用“竞争学习”的方式,每个输入的样例在输出层中找到一个和它最匹配的节点,称为激活节点,也叫winning neuron;紧接着用随机梯度下降法更新激活节点的参数;同时,和激活节点临近的点也根据它们距离激活节点的远近而适当地更新参数。这种竞争可以通过神经元之间的横向抑制连接(负反馈路径)来实现。自组织映射神经网络的输出层节点是有拓扑关系的。这个拓扑关系依据需求确定,如果想要一维的模型,那么隐藏节点可以是“一维线阵”;如果想要二维的拓扑关系,那么就行成一个“二维平面阵”,如图5.8所示。也有更高维度的拓扑关系的,比如“三维栅格阵”,但并不常见。
1700535550
1700535551
1700535552
1700535553
1700535554
图5.8 SOM常见的两种网络结构
1700535555
1700535556
1700535557
1700535558
假设输入空间是D维,输入模式为,输入单元i和神经元j之间在计算层的连接权重为,其中N是神经元的总数。自组织映射神经网络的自组织学习过程可以归纳为以下几个子过程。
1700535559
1700535560
(1)初始化。所有连接权重都用小的随机值进行初始化。
1700535561
1700535562
1700535563
(2)竞争。神经元计算每一个输入模式各自的判别函数值,并宣布具有最小判别函数值的特定神经元为胜利者,其中每个神经元j的判别函数为。
1700535564
1700535565
1700535566
1700535567
(3)合作。获胜神经元I(x)决定了兴奋神经元拓扑邻域的空间位置。确定激活结点I(x)之后,我们也希望更新和它临近的节点。更新程度计算如下:,其中Sij表示竞争层神经元i和j之间的距离,随时间衰减;简单地说,临近的节点距离越远,更新的程度要打更大折扣。
1700535568
1700535569
1700535570
1700535571
(4)适应。适当调整相关兴奋神经元的连接权重,使得获胜的神经元对相似输入模式的后续应用的响应增强:, 其中依赖于时间的学习率定义为:。
1700535572
1700535573
(5)迭代。继续回到步骤(2),直到特征映射趋于稳定。
1700535574
1700535575
在迭代结束之后,每个样本所激活的神经元就是它对应的类别。
[
上一页 ]
[ :1.700535526e+09 ]
[
下一页 ]