Współpracownik analizuje niektóre dane biologiczne pod kątem swojej pracy doktorskiej z pewną nieprzyjemną heteroscedastycznością (rysunek poniżej). Analizuje to za pomocą modelu mieszanego, ale nadal ma problemy z resztkami.
Logarytmiczne przekształcanie zmiennych odpowiedzi czyści wszystko i na podstawie informacji zwrotnych na to pytanie wydaje się to właściwe podejście. Początkowo sądziliśmy jednak, że wystąpiły problemy z użyciem transformowanych zmiennych w modelach mieszanych. Okazuje się, że błędnie zinterpretowaliśmy stwierdzenie w SAS Littell & Milliken (2006) dla modeli mieszanych, które wskazywało, dlaczego niewłaściwe jest przekształcanie danych zliczania, a następnie analizowanie ich za pomocą normalnego liniowego modelu mieszanego (pełny cytat poniżej) .
Podejście, które poprawiło również wartości resztkowe, polegało na zastosowaniu uogólnionego modelu liniowego z rozkładem Poissona. Czytałem, że rozkład Poissona można wykorzystać do modelowania ciągłych danych (np. Jak omówiono w tym poście ), a pakiety statystyk na to pozwalają, ale nie rozumiem, co się stanie, gdy model będzie pasował.
W celu zrozumienia, w jaki sposób wykonywane są obliczenia, moje pytania brzmią: kiedy dopasujesz rozkład Poissona do danych ciągłych, 1) czy dane są zaokrąglane do najbliższej liczby całkowitej 2) czy powoduje to utratę informacji i 3) Kiedy, jeśli w ogóle, właściwe jest stosowanie modelu Poissona dla ciągłych danych?
Littel & Milliken 2006, str. 529 "transformacja danych [zliczania] może przynieść efekt przeciwny do zamierzonego. Na przykład transformacja może zniekształcić rozkład efektów modelu losowego lub liniowość modelu. Co ważniejsze, transformacja danych wciąż pozostawia otwartą możliwość negatywnych przewidywanych zliczeń. W związku z tym wnioskowanie na podstawie modelu mieszanego z wykorzystaniem przekształconych danych jest wysoce podejrzane ”.