Próbuję zrozumieć zastosowanie PCA w niedawnym artykule w czasopiśmie zatytułowanym „Mapowanie aktywności mózgu na dużą skalę za pomocą obliczeń klastrowych” Freeman i in., 2014 (bezpłatny plik pdf dostępny na stronie laboratorium ). Używają PCA do danych szeregów czasowych i wykorzystują wagi PCA do stworzenia mapy mózgu.
Dane to średnie dane obrazowania z próby, przechowywane jako macierz (zwana w dokumencie ) z wokselami (lub lokalizacjami obrazowania w mózgu) punktów czasowych (długość pojedynczego stymulacja mózgu). nx t
Używają SVD, czego wynikiem jest ( wskazujący na transpozycję macierzy ).V⊤V
Autorzy twierdzą, że
Głównymi składnikami (kolumny ) są wektory długości , a wyniki (kolumny ) są wektorami o długości (liczba wokseli), opisującymi rzut każdego woksela na kierunek podane przez odpowiedni komponent, tworząc rzuty na objętość, tj. mapy całego mózgu.T U n
Komputery są więc wektorami długości . Jak mogę zinterpretować, że „pierwszy główny składnik wyjaśnia największą wariancję”, co jest często wyrażane w tutorialach PCA? Zaczęliśmy od macierzy wielu wysoce skorelowanych szeregów czasowych - jak pojedynczy szereg czasowy na PC wyjaśnia wariancję w oryginalnej macierzy? Rozumiem cały „obrót Gaussowskiej chmury punktów do najbardziej zróżnicowanej osi”, ale nie jestem pewien, w jaki sposób odnosi się to do szeregów czasowych. Co autorzy rozumieją przez kierunek, gdy stwierdzają: „wyniki (kolumny ) są wektorami o długości n (liczba wokseli), opisujący rzut każdego woksela na kierunek podany przez odpowiedni komponent „? W jaki sposób kurs czasowy głównego komponentu może mieć kierunek?
Aby zobaczyć przykład wynikowej szeregu czasowego z liniowych kombinacji podstawowych składników 1 i 2 oraz powiązanej mapy mózgu, przejdź do następującego łącza i najedź myszką na kropki na wykresie XY.
Moje drugie pytanie dotyczy trajektorii (przestrzeni stanów), które tworzą za pomocą głównych ocen składowych.
Są one tworzone przez pobranie pierwszych 2 wyników (w przypadku przykładu „optomotor”, który opisałem powyżej) i rzutowanie poszczególnych prób (wykorzystanych do utworzenia matrycy uśrednionej z próby opisanej powyżej) do głównej podprzestrzeni równaniem:
Jak widać w połączonych filmach, każdy ślad w przestrzeni stanów reprezentuje aktywność mózgu jako całości.
Czy ktoś może podać intuicję, co oznacza każda „klatka” filmu w przestrzeni stanów, w porównaniu do liczby, która kojarzy wykres XY wyników pierwszych 2 komputerów. Co to znaczy przy danej „ramce”, że 1 próba eksperymentu znajduje się w 1 pozycji w przestrzeni stanów XY i kolejna próba jest w innej pozycji? W jaki sposób pozycje fabuły XY w filmach odnoszą się do głównych śladów składowych na połączonej figurze wspomnianej w pierwszej części mojego pytania?