1700508149
1700508150
wx+b=0
1700508151
1700508152
x是一个m维的向量,或表示成一个m ×1的矩阵。w是一个1× m的矩阵。b是一个实数。
1700508153
1700508154
分类的决策函数是
1700508155
1700508156
1700508157
1700508158
1700508159
也称作“线性可分支持向量机”。
1700508160
1700508161
1700508162
以二维空间的向量为例,最后希望用如图11-34所示的方式找到超平面wx+b=0,其中需要学习的就是w和b。在这里有一个假设,就是在分类正确的情况下距离超平面越远的点其确信程度越高,也就是在超平面方程wx+b=0给定的情况下,可以使用一个间隔函数个向量到超平面的距离。
1700508163
1700508164
1700508165
1700508166
1700508167
图11-34 二维空间向量超平面
1700508168
1700508169
某个向量点xi到超平面的距离用欧氏距离(Euclidean Metric)表示,可以写作
1700508170
1700508171
1700508172
1700508173
1700508174
根据yi取值的特点,可以写作
1700508175
1700508176
1700508177
1700508178
1700508179
因此也叫作“几何间隔”。其中,||w||叫作“范数”,在欧式空间中的欧式范数定义为
1700508180
1700508181
1700508182
1700508183
1700508184
是向量的模。
1700508185
1700508186
几何间隔在空间几何上有具体的几何距离解释,这和我们在二维空间中求点到直线的距离及在三维空间中求点到平面的距离的计算方式是一样的。如果在规范化后,令||w||=1,间隔距离可以写作
1700508187
1700508188
1700508189
1700508190
1700508191
也叫作“函数间隔”。
1700508192
1700508193
定义一个训练集中的样本点到超平面wx+b=0几何距离最小的点
1700508194
1700508195
1700508196
1700508197
1700508198
所以,现在的问题就变成了怎样让γ最大化。
[
上一页 ]
[ :1.700508149e+09 ]
[
下一页 ]