Robię analizę Matlaba na danych MRI, gdzie wykonałem PCA na matrycy o wymiarach 10304x236, gdzie 10304 to liczba wokseli (traktuj je jako piksele), a 236 to liczba punktów czasowych. PCA daje mi 236 wartości własnych i powiązanych z nimi współczynników. Wszystko w porządku. Jednak, gdy nadchodzi czas, aby zdecydować, ile elementów zachować, powielam artykuł, który zawiera następujące informacje (proszę o informację, czy konieczne jest wyjaśnienie, ponieważ jest to tylko krótka część całego dokumentu):
Następnie przeprowadziliśmy symulacje Monte Carlo, aby określić liczbę głównych komponentów (PC) do wyodrębnienia z uciążliwych danych ROI dla każdego skanu. Rozkład zerowy oczekiwanych wartości własnych został wygenerowany osobno dla danych kodujących i spoczynkowych dla każdego pacjenta, wykonując PCA na normalnie rozłożonych danych o równej randze z danymi ROI uciążliwego kodowania i spoczynkowej. Komputery PC z prawdziwych uciążliwych danych ROI zostały następnie wybrane do danego skanu odpoczynku lub kodowania, jeśli ich powiązane wartości własne przekroczyły 99. przedział ufności wartości własnych z symulacji Monte Carlo.
Nie mam absolutnie pojęcia, co tu robić. Jestem przyzwyczajony do wybierania składników na podstawie wyjaśnionej skumulowanej wariancji. Myślę jednak o tym:
Następnie przeprowadziliśmy symulacje Monte Carlo, aby określić liczbę głównych komponentów (PC) do wyodrębnienia z uciążliwych danych ROI dla każdego skanu.
Simy z Monte Carlo oznaczają po prostu wykonanie 1000 (lub mniej więcej) razy, prawda?
Rozkład zerowy oczekiwanych wartości własnych został wygenerowany przez wykonanie PCA na normalnie rozłożonych danych o równej wartości względem danych ROI uciążliwego kodowania i spoczynkowej.
Po pierwsze, zakładam, że „równa ranga” będzie zasadniczo oznaczać, że utworzę matrycę tego samego rozmiaru co oryginał (10304 x 236). Jeśli chodzi o „normalnie rozmieszczone dane o równej randze” ... czy to oznacza, że powinienem utworzyć macierz liczb losowych 10304 x 236 z rozkładu normalnego? Matlab ma funkcję o nazwie „normrnd”, która to robi, ale wymaga danych wejściowych mu i sigma. Czy użyłbym tego samego mu i sigma co te pochodzące z początkowego zestawu danych? Czy to mniej więcej oznacza „oczekiwane wartości własne”, ponieważ nie mam pojęcia, jak wyglądałby rozkład OCZEKIWANYCH wartości własnych.
Myślę, że mój problem jest mniej więcej taki, że nie wiem, jak zrobić „zerowy rozkład” wartości własnych.