Jakie techniki graficzne są stosowane w modelowaniu równań strukturalnych?


14

Jestem ciekawy, czy istnieją specjalne techniki graficzne, które można zastosować do modelowania równań strukturalnych. Wydaje mi się, że to można podzielić na kategorie narzędzi eksploracyjnych do analizy kowariancji lub diagnostyki graficznej do oceny modelu SEM. (Tak naprawdę nie mam tu na myśli diagramów ścieżek / wykresów.)


Termin „SEM” jest niejasny. Może to również oznaczać „marketing w wyszukiwarkach”, na przykład dla kogoś, kto szuka technik analizy statystycznej do badania danych dotyczących kliknięć reklam lub oceny skuteczności reklamy. Zastanów się nad tym, aby tytuł był bardziej szczegółowy.
Paul

Odpowiedzi:


13

Poznałem Laurę Trinchera, która wniosła ładny pakiet R do modelowania ścieżek PLS, plspm . Zawiera kilka graficznych danych wyjściowych dla różnego rodzaju struktur danych 2- i k-blokowych.

Właśnie odkryłem pakiet plotSEMM R. Jest to jednak bardziej związane z twoim drugim punktem i ogranicza się do tworzenia wykresów zależności dwuwymiarowych.

Jeśli chodzi o ostatnie odniesienia do wykresu diagnostycznego dla SEM, oto dwa artykuły, które mogą być interesujące (dla drugiego, właśnie przeglądałem streszczenie niedawno, ale nie mogę znaleźć wersji bez interfejsu):

  1. Sanchez BN, Houseman EA i Ryan LM. Diagnostyka resztkowa modeli równań strukturalnych . Biometrics (2009) 65, 104–115
  2. Yuan KH i Hayashi K. Dopasowywanie danych do modelu: Diagnoza modelowania równań strukturalnych za pomocą dwóch wykresów rozrzutu , Metody psychologiczne (2010)
  3. Porzio GC i Vitale MP. Odkrywanie interakcji w modelach równań strukturalnych za pomocą wykresu diagnostycznego . 58. Światowy Kongres ISI (2011).

@chl: dzięki! Pamiętam, że plspm został ogłoszony na liście semnetów - z jakiegoś powodu PLS nie jest tak duży po tej stronie Atlantyku, nie jestem pewien, dlaczego. plotSEMM wygląda naprawdę interesująco, nie mogę się doczekać, aby się nim bawić.
ars

@chl: btw, chciałem dodać, że szkoda, że ​​PLS nie jest tutaj bardziej zauważany, ponieważ wydaje się, że dzieje się wokół niego wiele ekscytujących rzeczy, szczególnie z opracowywanymi narzędziami (np. SmartPLS oprócz plspm). Jakiś czas temu czytałem niektóre prace Wolda, a niektóre z jego pomysłów są dopiero realizowane (np. „Rozmowa z twoimi danymi”). Naprawdę muszę poświęcić trochę czasu, aby lepiej to zbadać.
ars

@ars Czy chcesz listę polecanych lektur? Współpracowałem również z Arturem Tenenhausem, który przesłał fajny artykuł ze swoim ojcem (tak, Michel Tenenhaus) do Psychometriki: Łączą wszystkie metody dwóch bloków (PCA, CCA, PLS, między bateriami itp.) Dzięki bardzo zgrabnemu przepisz ograniczenie argmax. Bawiłem się karanym PLS / CCA (L1 / L2) w genomice, ale czuję, że przyniesie to więcej interesujących danych biomedycznych.
chl

1
@ars Chciałbym zaproponować następujące artykuły od Father & Son: j.mp/dvEDgb , j.mp/csD1Yf , j.mp/dkEHq5 .
chl

4

To bardzo interesujące pytanie. Załóżmy, że mamy dwuwymiarową macierz kowariancji (bardzo nierealistyczny przykład dla SEM, ale proszę o wyrozumiałość). Następnie możesz wykreślić izo-kontury dla obserwowanej macierzy kowariancji względem szacowanej macierzy kowariancji, aby uzyskać dopasowanie modelu.

Jednak w rzeczywistości będziesz mieć wielowymiarową macierz kowariancji. W takiej sytuacji prawdopodobnie można wykonać kilka wykresów dwuwymiarowych, biorąc jednocześnie dwie zmienne. Nie jest to idealne rozwiązanie, ale może do pewnego stopnia pomóc.

Edytować

Nieco lepszą metodą jest wykonanie analizy głównych składników (PCA) na zaobserwowanej macierzy kowariancji. Zapisz macierz projekcji z analizy PCA na obserwowanej macierzy kowariancji. Użyj tej macierzy projekcji, aby przekształcić macierz szacowanej kowariancji.

Następnie wykreślamy izo-kontury dla dwóch najwyższych wariancji obróconej obserwowanej macierzy kowariancji względem szacowanej macierzy kowariancji. W zależności od tego, ile wykresów chcemy wykonać, możemy wziąć drugą i trzecią najwyższą wariancję itp. Zaczynamy od najwyższych wariancji, ponieważ chcemy wyjaśnić jak największą różnorodność naszych danych.


Srikant, dzięki za odpowiedź! Nie jestem pewien, co masz na myśli przez konturowe wykresy kowariancji (obs v est) - czy mógłbyś to rozwinąć? Dzięki.
ars

Zobacz: en.wikipedia.org/wiki/Level_set . Niech Sigma będzie 2-wymiarową macierzą kowariancji i Y ~ N (0, Sigma). Linia izo-konturowa wykreśliłaby zbiór punktów Y, dla których f (Y | sigma) = c, gdzie c jest stałą. Zauważ, że Y jest 2-wymiarowym wektorem. Wybrałbyś różne wartości c, a tym samym uzyskałeś różne linie izo-konturowe, które dałyby ci poczucie rozłożenia rozkładu.

@Sikikant, dzięki za sugestię. Spędziłem trochę czasu na wypróbowaniu go i wydaje mi się, że to dobry początek w uzyskaniu szybkiego porównania wizualnego, zwłaszcza gdy dopasowanie jest złe.
ars

2

Przypuszczam, że można wykonać wielowymiarowe skalowanie macierzy korelacji lub kowariancji. Nie jest to dokładnie modelowanie równań strukturalnych, ale może uwypuklać wzorce i struktury w macierzy korelacji lub kowariancji. Można to następnie sformalizować za pomocą odpowiedniego modelu.


Dzięki Jeromy. Wystarczy przeczytać wpis w Wikipedii dotyczący MDS - wygląda na to, że może gdzieś prowadzić.
ars

0

Jeśli występuje efekt interakcji (lub nawet w inny sposób), możesz użyć oprogramowania ITALASSI v1.2 (darmowe oprogramowanie), aby uzyskać widoki 2D i 3D

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.