Czy istnieje nazwa dla tego typu ładowania początkowego?


9

Rozważ eksperyment z wieloma ludzkimi uczestnikami, z których każdy jest mierzony wiele razy w dwóch warunkach. Model efektów mieszanych można sformułować (używając składni lme4 ) jako:

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

Powiedzmy, że chcę wygenerować przedziały ufności ładowania początkowego dla prognoz tego modelu. Myślę, że wymyśliłem prostą i wydajną obliczeniowo metodę i jestem pewien, że nie jestem pierwszym, który to wymyślił, ale mam trudności ze znalezieniem jakichkolwiek wcześniejszych publikacji opisujących to podejście. Oto on:

  1. Dopasuj model (jak wyżej), nazwij to „oryginalnym modelem”
  2. Uzyskaj prognozy z oryginalnego modelu, nazwij je „oryginalnymi prognozami”
  3. Uzyskaj resztki z oryginalnego modelu związanego z każdą odpowiedzią od każdego uczestnika
  4. Ponownie próbkuj resztki, pobierając próbki uczestników z wymianą
  5. Dopasuj liniowy model efektów mieszanych z błędem gaussa do reszt , nazwij to „modelem przejściowym”
  6. Oblicz prognozy z modelu przejściowego dla każdego warunku (te prognozy będą bardzo bliskie zeru), nazwij je „prognozami przejściowymi”
  7. Dodaj prognozy tymczasowe do pierwotnych prognoz, nazwij wynik „prognozami ponownego próbkowania”
  8. Powtórz kroki od 4 do 7 wiele razy, generując rozkład prognoz ponownego próbkowania dla każdego warunku, z którego można raz obliczyć CI.

Widziałem procedury „resztkowego ładowania początkowego” w kontekście prostej regresji (tj. Nie modelu mieszanego), w której próbki są próbkowane jako jednostka ponownego próbkowania, a następnie dodawane do prognoz oryginalnego modelu przed dopasowaniem nowego modelu przy każdej iteracji bootstrap, ale wygląda to raczej inaczej niż podejście, które opisuję, w którym pozostałości nie są nigdy ponownie próbkowane, ludzie są i tylko pomodel przejściowy jest uzyskiwany, gdy w grę wchodzą prognozy modelu pierwotnego. Ta ostatnia cecha ma naprawdę fajną zaletę uboczną, ponieważ bez względu na złożoność oryginalnego modelu, model przejściowy może zawsze pasować jako gaussowski liniowy model mieszany, który w niektórych przypadkach może być znacznie szybszy. Na przykład ostatnio miałem dane dwumianowe i 3 zmienne predykcyjne, z których jedną, jak podejrzewałem, wywołałoby silnie nieliniowe efekty, więc musiałem zastosować uogólnione mieszane modelowanie addytywne za pomocą funkcji dwumianowego połączenia. Montaż oryginalnego modelu w tym przypadku trwał ponad godzinę, a montaż gaussowskiego LMM przy każdej iteracji zajął zaledwie kilka sekund.

Naprawdę nie chcę ubiegać się o pierwszeństwo w tej sprawie, jeśli jest to już znana procedura, więc byłbym bardzo wdzięczny, gdyby ktokolwiek mógł podać informacje na temat tego, jak to mogło być wcześniej opisane. (Ponadto, jeśli są jakieś rażące problemy z tym podejściem, daj mi znać!)


1
Tylko komentarz boczny, ale może być istotny. Peter McCullagh ma artykuł w Bernoulli, w którym pokazuje, że żaden bootstrap nie ocenia poprawnie wariancji w modelu efektów losowych.
kardynał

@Mike (+1) To jedno bardzo dobrze napisane pytanie!
chl

1
Dlaczego nie miałbyś ponownie próbkować uczestników z wymianą, a następnie ponownie próbkować ich danych? Wydaje się, że jest to bardziej zgodne z duchem modelu wielopoziomowego z jednym rozkładem zagnieżdżonym w drugim. Inną kwestią jest to, że istnieje potencjalny problem z danymi dwumianowymi, ponieważ skrajne końce próbek będą mniej prawdopodobne.
John

@John: Wolę ponowne próbkowanie reszt, ponieważ (1) jest to szybsze, gdy oryginalny model jest pracochłonny do oszacowania, i (2) daje CI, które usunęły zmienność związaną ze zmiennością między środkami uczestnika. # 2 oznacza, że ​​nie trzeba tworzyć wielu wykresów, aby wyświetlić surowe dane i efekt powtarzanych pomiarów; możesz po prostu wykreślić te CI z usuniętymi wariancjami na surowych danych i będą one odpowiednie do porównania warunków powtarzanych w obrębie poszczególnych osób. To prawda, że ​​może istnieć zamieszanie co do znaczenia takich elementów CI, ale po to są napisy do figur.
Mike Lawrence

@John: Czy mógłbyś rozwinąć swoje obawy dotyczące zastosowania tego podejścia do danych dwumianowych?
Mike Lawrence

Odpowiedzi:


-1

Moja książka Bootstrap Methods 2nd Edition ma obszerną bibliografię do 2007 roku. Więc nawet jeśli nie omówię tematu w książce, odniesienie może znajdować się w bibliografii. Oczywiście wyszukiwanie w Google z odpowiednimi słowami kluczowymi może być lepsze. Freedman, Peters i Navidi przeprowadzili ładowanie wstępne w celu przewidywania w regresji liniowej i modelach ekonometrycznych, ale nie jestem pewien, co zrobiono w przypadku modelu mieszanego. Gazeta Stine z 1985 r. Częstotliwość przewidywania Bootstrap dla regresji jest bardzo interesująca, jeśli jeszcze jej nie widziałeś.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.