打字猴:1.700535001e+09

1700535001

1700535002

1700535003

1700535004

1700535005 （4.18）

1700535006

1700535007 容易发现，当ω方向与（μ1−μ2）一致的时候，该距离达到最大值，例如对图4.5（a）的黄棕两种类别的样本点进行降维时，若按照最大化两类投影中心距离的准则，会将样本点投影到下方的黑线上。但是原本可以被线性划分的两类样本，经过投影后有了一定程度的重叠，这显然不能使我们满意。

1700535008

1700535009 我们希望得到的投影结果如图4.5（b）所示，虽然两类的中心在投影之后的距离有所减小，但确使投影之后样本的可区分性提高了。

1700535010

1700535011 仔细观察两种投影方式的区别，可以发现，在图4.5（b）中，投影后的样本点似乎在每一类中分布得更为集中了，用数学化的语言描述就是每类内部的方差比左图中更小。这就引出了LDA的中心思想——最大化类间距离和最小化类内距离。

1700535012

1700535013

1700535014

1700535015

1700535016 （a）最大化两类投影中心距离准则下得到的分类结果

1700535017

1700535018

1700535019

1700535020

1700535021 （b）使得投影后样本区分性更高的投影方式

1700535022

1700535023 图4.5　两种不同的投影方向与投影后的分类结果

1700535024

1700535025 在前文中我们已经找到了使得类间距离尽可能大的投影方式，现在只需要同时优化类内方差，使其尽可能小。我们将整个数据集的类内方差定义为各个类分别的方差之和，将目标函数定义为类间距离和类内距离的比值，于是引出我们需要最大化的目标

1700535026

1700535027

1700535028 ，

1700535029

1700535030 （4.19）

1700535031

1700535032 其中ω为单位向量，D1，D2分别表示两类投影后的方差

1700535033

1700535034

1700535035

1700535036

1700535037

1700535038 ，

1700535039

1700535040 （4.20）

1700535041

1700535042

1700535043 ，

1700535044

1700535045 （4.21）

1700535046

1700535047 因此J(ω)可以写成

1700535048

1700535049

1700535050 ．

[ 上一页 ] [ :1.700535001e+09 ] [ 下一页 ]