1700534835
1700534836
1700534837
1700534838
图4.2 二维空间中经过中心化的一组数据
1700534839
1700534840
1700534841
1700534842
1700534843
图4.3 最小化样本点到直线的距离平方之和
1700534844
1700534845
数据集中每个点xk到d维超平面D的距离为
1700534846
1700534847
1700534848
,
1700534849
1700534850
(4.6)
1700534851
1700534852
1700534853
1700534854
1700534855
其中表示xk在超平面D上的投影向量。如果该超平面由d个标准正交基构成,根据线性代数理论可以由这组基线性表示
1700534856
1700534857
1700534858
,
1700534859
1700534860
(4.7)
1700534861
1700534862
1700534863
其中ωiTxk表示xk在ωi方向上投影的长度。因此,实际上就是xk在W这组标准正交基下的坐标。而PCA要优化的目标为
1700534864
1700534865
1700534866
1700534867
1700534868
(4.8)
1700534869
1700534870
1700534871
由向量内积的性质,我们知道,于是将式(4.8)中的每一个距离展开
1700534872
1700534873
1700534874
1700534875
1700534876
(4.9)
1700534877
1700534878
1700534879
其中第一项与选取的W无关,是个常数。将式(4.7)代入式(4.9)的第二项和第三项可得到
1700534880
1700534881
1700534882
1700534883
1700534884
[
上一页 ]
[ :1.700534835e+09 ]
[
下一页 ]