1700537727
■ 基于算法的方法
1700537728
1700537729
在样本不均衡时,也可以通过改变模型训练时的目标函数(如代价敏感学习中不同类别有不同的权重)来矫正这种不平衡性;当样本数目极其不均衡时,也可以将问题转化为单类学习(one-class learning)、异常检测(anomaly detection)。本节主要关注采样,不再赘述。
1700537730
1700537731
·总结与扩展·
1700537732
1700537733
在实际面试时,这道题还有很多可扩展的知识点。例如,模型在不均衡样本集上的评价标准;不同样本量(绝对数值)下如何选择合适的处理方法(考虑正负样本比例为1∶100和1000∶100000的区别);代价敏感学习和采样方法的区别、联系以及效果对比等。
1700537734
1700537735
1700537736
1700537737
1700537739
百面机器学习:算法工程师带你去面试 第9章 前向神经网络
1700537740
1700537741
深度前馈网络(Deep Feedforward Networks)是一种典型的深度学习模型。其目标为拟合某个函数f,即定义映射y=f (x;θ)将输入x转化为某种预测的输出y,并同时学习网络参数θ的值,使模型得到最优的函数近似。由于从输入到输出的过程中不存在与模型自身的反馈连接,此类模型被称为“前馈”。
1700537742
1700537743
深度前馈网络通常由多个函数复合在一起来表示,该模型与一个有向无环图相关联,其中图则描述了函数的复合方式,例如“链式结构”f (x)=f(3)( f(2)( f(1)(x)))。链的全长定义为网络模型的“深度”。假设真实的函数为f (x),在神经网络的过程中,我们试图令f (x)拟合f (x)的值,而训练数据则提供在不同训练点上取值的f (x)的近似实例(可能包含噪声),即每个样本x伴随一个标签y≈f (x),指明输出层必须产生接近标签的值;而网络学习算法则需要决定如何使用中间的“隐藏层”来最优的实现f*的近似。
1700537744
1700537745
深度前馈网络是一类网络模型的统称,我们常见的多层感知机、自编码器、限制玻尔兹曼机,以及卷积神经网络等,都是其中的成员。
1700537746
1700537747
1700537748
1700537749
1700537751
百面机器学习:算法工程师带你去面试 01 多层感知机与布尔函数
1700537752
1700537753
1700537754
1700537755
场景描述
1700537756
1700537757
神经网络概念的诞生很大程度上受到了神经科学的启发。生物学研究表明,大脑皮层的感知与计算功能是分层实现的,例如视觉图像,首先光信号进入大脑皮层的V1区,即初级视皮层,之后依次通过V2层和V4层,即纹外皮层,进入下颞叶参与物体识别。深度神经网络,除了模拟人脑功能的多层结构,最大的优势在于能够以紧凑、简洁的方式来表达比浅层网络更复杂的函数集合(这里的“简洁”可定义为隐层单元的数目与输入单元的数目呈多项式关系)。我们的问题将从一个简单的例子引出,已知神经网络中每个节点都可以进行“逻辑与/或/非”的运算,如何构造一个多层感知机(Multi-Layer Perceptron,MLP)网络实现n个输入比特的奇偶校验码(任意布尔函数)?
1700537758
1700537759
知识点
1700537760
1700537761
数理逻辑,深度学习,神经网络
1700537762
1700537763
问题1 多层感知机表示异或逻辑时最少需要几个隐含层(仅考虑二元输入)?
1700537764
1700537765
难度:★★☆☆☆
1700537766
1700537767
分析与解答
1700537768
1700537769
首先,我们先来分析一下具有零个隐藏层的情况(等同于逻辑回归)能否表示异或运算。仅考虑二元输入的情况,设X取值为0或1,Y的取值也为0或1,Z为异或运算的输出。也就是,当X和Y相同时,异或输出为0,否则为1,具体的真值表如表9.1所示。
1700537770
1700537771
表9.1 异或运算的真值表
1700537772
1700537773
X
1700537774
1700537775
Y
1700537776
[
上一页 ]
[ :1.700537727e+09 ]
[
下一页 ]