Mam ogólne pytanie metodologiczne. Być może wcześniej na nie odpowiedziano, ale nie jestem w stanie zlokalizować odpowiedniego wątku. Docenię wskaźniki do możliwych duplikatów.
( Tutaj jest doskonałym jeden, ale bez odpowiedzi. To jest podobne w duchu, nawet z odpowiedzią, ale ten jest zbyt specyficzna z mojego punktu widzenia. To jest także w pobliżu, odkrył po zaksięgowaniu pytanie.)
Tematem przewodnim jest sposób prawidłowego wnioskowania statystycznego, gdy model sformułowany przed zobaczeniem danych nie opisuje odpowiednio procesu generowania danych . Pytanie jest bardzo ogólne, ale przedstawię konkretny przykład ilustrujący tę kwestię. Oczekuję jednak, że odpowiedzi skoncentrują się na ogólnym pytaniu metodologicznym, a nie na szczegółach konkretnego przykładu.
Rozważmy konkretny przykład: w ustawieniach szeregów czasowych zakładam, że proces generowania danych to z . Chciałbym przetestować hipotezę merytoryczną, że . Rzuciłem to na model aby uzyskać wykonalny statystyczny odpowiednik mojej hipotezy przedmiotowej, a jest to Na razie w porządku. Ale kiedy obserwuję dane, odkrywam, że model nie opisuje odpowiednio danych. Powiedzmy, że istnieje trend liniowy, więc prawdziwy proces generowania danych to z
Jak mogę dokonać prawidłowego wnioskowania statystycznego na temat mojej hipotezy merytorycznej ?
Jeśli oryginalnego modelu, jego założenia zostaną naruszone, a estymator nie ma tak ładnego rozkładu, jak w innym przypadku. Dlatego nie mogę przetestować hipotezy za pomocą testu .
Jeśli po obejrzeniu danych przełączę się z modelu na i zmienię hipotezę statystyczną z na , założenia modelu są spełnione i ja uzyskaj dobrze zachowujący się estymator i możesz bez problemu przetestować za pomocą testu . Jednak zmiana z na
informuje mnie zbiór danych, na którym chcę przetestować hipotezę. To uzależnia rozkład estymatora (a tym samym również wnioskowanie) od zmiany modelu bazowego, co wynika z obserwowanych danych. Oczywiście wprowadzenie takich uwarunkowań nie jest zadowalające.
Czy istnieje dobre wyjście? (Jeśli nie częsty, to może jakaś Bayesowska alternatywa?)