To wydaje się takie elementarne, ale zawsze utknąłem w tym momencie…
Większość danych, z którymi mam do czynienia, jest nienormalna, a większość analiz opartych na strukturze GLM. Do mojej obecnej analizy mam zmienną odpowiedzi, która jest „prędkością marszu” (metry / minutę). Łatwo jest mi stwierdzić, że nie mogę korzystać z OLS, ale mam dużą niepewność przy podejmowaniu decyzji, która rodzina (Gamma, Weibull itp.) Jest odpowiednia!
Używam Stata i patrzę na diagnostykę, takie jak resztki i heteroscedastyczność, resztki vs. wartości dopasowane itp.
Zdaję sobie sprawę, że dane zliczeniowe mogą przybrać formę częstości (np. Częstości występowania) i wykorzystały gamma (analogiczne do nadmiernie rozproszonych dyskretnych modeli dwumianowych dyskretnych), ale po prostu chciałbym, aby „strzelający pistolet” powiedział TAK, MASZ PRAWO RODZINA. Czy spojrzenie na znormalizowane wartości resztowe w stosunku do dopasowanych wartości jest jedynym i najlepszym sposobem na to? Chciałbym użyć modelu mieszanego do uwzględnienia pewnej hierarchii danych, ale najpierw muszę ustalić, która rodzina najlepiej opisuje moją zmienną odpowiedzi.
Każda pomoc doceniona. Szczególnie ceniony jest język Stata!