Bawiłem się metodami PCA i LDA i utknąłem w pewnym momencie, mam wrażenie, że jest to tak proste, że nie widzę tego.
Macierze rozproszenia wewnątrz klasy ( ) i między klasami ( S_B ) są zdefiniowane jako:S BSWSB
SW=∑i=1C∑t=1N(xit−μi)(xit−μi)T
SB=∑i=1CN(μi−μ)(μi−μ)T
Całkowita macierz rozproszenia ST jest podawana jako:
S.T.= ∑i = 1do∑t = 1N.( xjat- μ ) ( xjat- μ )T.= SW.+ Sb
gdzie C to liczba klas, a N to liczba próbek x to próbki, μja to i-ta średnia klasy, μ to średnia średnia.
Próbując wyprowadzić S.T. doszedłem do punktu, w którym miałem:
( x - μja) ( μja- μ )T.+ ( μja- μ ) ( x - μja)T.
jako termin. To musi być zero, ale dlaczego?
W rzeczy samej:
S.T.= ∑i = 1do∑t = 1N.( xjat- μ ) ( xjat- μ )T.= ∑i = 1do∑t = 1N.( xjat- μja+ μja- μ ) ( xjat- μja+ μja- μ )T.= SW.+ Sb+ ∑i = 1do∑t = 1N.[ (xjat- μja) ( μja- μ )T.+ ( μja- μ ) ( xjat- μja)T.]