Czym różnią się PCA i klasyczny MDS? Co powiesz na MDS a niemetryczny MDS? Czy jest czas, kiedy wolisz jeden od drugiego? Czym różnią się interpretacje?
Czym różnią się PCA i klasyczny MDS? Co powiesz na MDS a niemetryczny MDS? Czy jest czas, kiedy wolisz jeden od drugiego? Czym różnią się interpretacje?
Odpowiedzi:
Metryka MDS klasycznego Torgersona jest faktycznie wykonywana przez przekształcenie odległości w podobieństwa i wykonanie na nich PCA (rozkład własny lub rozkład wartości osobliwych). [Inną nazwą tej procedury ( distances between objects -> similarities between them -> PCA
przy czym obciążenia są poszukiwanymi współrzędnymi) jest główna analiza współrzędnych lub PCoA .] Zatem PCA można nazwać algorytmem najprostszego MDS.
Niemetryczny MDS opiera się na iteracyjnym algorytmie ALSCAL lub PROXSCAL (lub podobnym algorytmie), który jest bardziej uniwersalną techniką mapowania niż PCA i może być również stosowany do metrycznego MDS. Podczas gdy PCA zachowuje dla ciebie m ważne wymiary, ALSCAL / PROXSCAL dopasowuje konfigurację do m wymiarów (wstępnie definiujesz m ) i odtwarza różnice na mapie bardziej bezpośrednio i dokładniej niż zwykle PCA (patrz sekcja ilustracji poniżej).
Tak więc MDS i PCA prawdopodobnie nie są na tym samym poziomie, aby być w linii lub naprzeciw siebie. PCA to tylko metoda, podczas gdy MDS to klasa analizy. Jako mapowanie PCA jest szczególnym przypadkiem MDS. Z drugiej strony PCA jest szczególnym przypadkiem analizy czynnikowej, która będąc redukcją danych, jest czymś więcej niż tylko mapowaniem, podczas gdy MDS jest tylko mapowaniem.
Jeśli chodzi o twoje pytanie dotyczące metrycznego MDS vs. niemetrycznego MDS, niewiele jest komentarzy, ponieważ odpowiedź jest prosta. Jeśli uważam, że moje podobieństwa wejściowe są tak bliskie odległościom euklidesowym, że wystarczy transformacja liniowa do odwzorowania ich w przestrzeni m-wymiarowej, wolę metryczny MDS. Jeśli nie wierzę, konieczna jest transformacja monotoniczna, co oznacza użycie niemetrycznego MDS.
Uwaga na temat terminologii dla czytelnika. Termin Classic (al) MDS (CMDS) może mieć dwa różne znaczenia w szerokiej literaturze na temat MDS, więc jest niejednoznaczny i należy go unikać. Jedną z definicji jest to, że CMDS jest synonimem miernika MDS Torgersona. Inną definicją jest to, że CMDS to dowolny MDS (według dowolnego algorytmu; analiza metryczna lub niemetryczna) z wejściem z pojedynczą matrycą (ponieważ istnieją modele analizujące wiele macierzy jednocześnie - Indywidualny model „INDSCAL” i model replikowany).
Ilustracja do odpowiedzi . Pewna chmura punktów (elipsa) jest odwzorowywana na jednowymiarowej mapie mds. Para punktów pokazana jest w czerwonych kropkach.
Iteracyjny lub „prawdziwy” MDS ma na celu odtworzenie par odległości między obiektami. Jest to bowiem zadaniem każdego MDS . Różne kryteria naprężeń lub Misfit może być minimalizowane pomiędzy O riginal odległości i odległości, na m ap: , ‖ D 2 O - D 2 m ‖ 1 , ‖ D O - D m ‖ 1 . Algorytm może (niemetryczny MDS) lub nie (metryczny MDS) zawierać w ten sposób transformację monotoniczną.
MDS oparty na PCA (Torgerson's lub PCoA) nie jest prosty. Minimalizuje kwadratowe odległości między obiektami w pierwotnej przestrzeni i ich obrazami na mapie. To nie jest całkiem prawdziwe zadanie MDS; odnosi sukces, jako MDS, tylko w takim stopniu, w jakim odrzucone mniejsze główne osie są słabe. Jeśli wyjaśnia wiele więcej niż wariancji P 2 były może sam właściwie odzwierciedlają parami odległości w chmurze, zwłaszcza za punkty leżące daleko od siebie wzdłuż elipsy. Iteracyjny MDS zawsze wygrywa, zwłaszcza gdy mapa jest bardzo mało wymiarowa. Iteracyjny MDS również odniesie większy sukces, gdy elipsa chmurowa jest cienka, ale lepiej wypełni zadanie mds niż PCoA. Według właściwości macierzy podwójnego centrowania (opisanej tutaj) wydaje się, że PCoA minimalizuje , co różni się od któregokolwiek z powyższych minimalizacji.
Po raz kolejny PCA rzutuje punkty chmurowe na najbardziej korzystną podprzestrzeń oszczędzania dla wszystkich osób. Nie wyświetla par odległości , względnych lokalizacji punktów w podprzestrzeni, które są najbardziej oszczędne pod tym względem, tak jak robi to iteracyjny MDS. Niemniej jednak historycznie PCoA / PCA jest uważane za jedną z metod metrycznego MDS.
Uhm ... całkiem inaczej. W PCA otrzymujesz ciągłe dane wielowymiarowe (wektor wielowymiarowy dla każdego przedmiotu) i próbujesz dowiedzieć się, czy nie potrzebujesz tylu wymiarów, aby je konceptualizować. W (metrycznym) MDS podano macierz odległości między obiektami i próbujesz dowiedzieć się, jakie są położenia tych obiektów w przestrzeni (i czy potrzebujesz przestrzeni 1D, 2D, 3D itd.). W niemetrycznym MDS wiesz tylko, że obiekty 1 i 2 są bardziej odległe niż obiekty 2 i 3, więc próbujesz to oszacować, oprócz znalezienia wymiarów i lokalizacji.
Dzięki znacznej wyobraźni można powiedzieć, że wspólnym celem PCA i MDS jest wizualizacja obiektów w 2D lub 3D. Ale biorąc pod uwagę, jak różne są dane wejściowe, metody te nie będą omawiane jako nawet odległe w żadnym podręczniku na wielu odmianach. Sądzę, że możesz przekonwertować dane użyteczne dla PCA na dane użyteczne dla MDS (powiedzmy, obliczając odległości Mahalanobisa między obiektami, używając przykładowej macierzy kowariancji), ale natychmiast spowodowałoby to utratę informacji: MDS jest tylko zdefiniowany do lokalizacji i rotacji, a dwa ostatnie można zrobić bardziej informacyjnie za pomocą PCA.
Gdybym miał krótko pokazać komuś wyniki niemetrycznego MDS i chciałbym dać mu przybliżone wyobrażenie o tym, co robi bez wchodzenia w szczegóły, mógłbym powiedzieć:
Biorąc pod uwagę posiadane przez nas miary podobieństwa lub odmienności, staramy się mapować nasze obiekty / podmioty w taki sposób, aby „miasta”, które tworzą, miały między nimi odległości, które są tak bliskie tym miarom podobieństwa, jak to możliwe. Możemy jednak idealnie odwzorować je tylko w przestrzeni wymiarowej, więc reprezentuję tutaj dwa najbardziej pouczające wymiary - coś w rodzaju tego, co zrobiłbyś w PCA, gdybyś pokazał zdjęcie z dwoma głównymi składowymi.
Zadanie metrycznego skalowania wielowymiarowego (MDS) można abstrakcyjnie sformułować w następujący sposób: biorąc pod uwagę macierz D par odległości między n punktami, znajdź nisko wymiarowe osadzenie punktów danych w R k, tak aby odległości euklidesowe między nimi były zbliżone do podane odległości: ‖ x i - x j ‖ ≈ D i j .
Jeśli „przybliżony” jest tutaj rozumiany w zwykłym sensie błędu rekonstrukcji, tj. Jeśli celem jest zminimalizowanie funkcji kosztu zwanej „naprężeniem”: wówczas rozwiązaniem jest nie odpowiada PCA. Rozwiązanie nie zawiera żadnej zamkniętej formuły i musi zostać obliczone przez dedykowany algorytm iteracyjny.
„Klasyczny MDS”, znany również jako „Torgerson MDS” zastępuje tę funkcję kosztów przez powiązanego ale nie równoważne , zwany „szczep”: który dąży do zminimalizowania błąd rekonstrukcji wyśrodkowanych produktów skalarnych zamiast odległości. Okazuje się, że K c mogą być obliczane od D (jeśli D są odległości euklidesowych) i minimalizacji błędu rekonstrukcji K c jest dokładnie to, co robi PCA, jak pokazano w następnym rozdziale.
Odniesienie: Elementy uczenia statystycznego , sekcja 18.5.2.
PCA daje DOKŁADNE takie same wyniki jak klasyczny MDS, jeśli zastosowana zostanie odległość euklidesowa.
Cytuję Cox & Cox (2001), s. 43–44:
Istnieje dwoistość między analizą składowych głównych a PCO [analiza głównych współrzędnych, czyli klasyczny MDS], gdzie różnice występują w odległości euklidesowej.
Sekcja w Cox & Cox wyjaśnia to dość wyraźnie:
same results as classical MDS
. „Klasyczny MDS” oznacza tutaj MDS Torgersona. To stwierdzenie jest rzeczywiście prawdziwe, ponieważ MDS Torgersona to tak naprawdę PCA (zaczynając od macierzy odległości). Jeśli inaczej zdefiniujesz „klasyczny MDS” (patrz moja odpowiedź), to stwierdzenie nie jest prawdziwe.
Porównanie: „Metryczny MDS daje taki sam wynik jak PCA” - proceduralnie - kiedy patrzymy na sposób użycia SVD do uzyskania optymalnego. Ale zachowane kryteria wielowymiarowe są inne. PCA wykorzystuje wyśrodkowaną macierz kowariancji, podczas gdy MDS wykorzystuje macierz gramów uzyskaną przez podwójne centrowanie macierzy odległości.