Pomijając oczywistą kwestię niskiej mocy chi-kwadrat w tego rodzaju okolicznościach, wyobraź sobie, że wykonujesz test dobroci chi-kwadrat dla pewnej gęstości z nieokreślonymi parametrami, poprzez binowanie danych.
Dla konkretności, powiedzmy rozkład wykładniczy z nieznaną średnią i wielkość próby powiedzmy 100.
Aby uzyskać rozsądną liczbę spodziewanych obserwacji na przedział, należałoby wziąć pod uwagę dane (np. Jeśli zdecydujemy się umieścić 6 przedziałów poniżej średniej i 4 powyżej, to nadal używamy granic przedziału na podstawie danych) .
Ale to wykorzystanie pojemników opartych na oglądaniu danych prawdopodobnie wpłynęłoby na rozkład statystyki testowej poniżej wartości zerowej.
Widziałem wiele dyskusji na temat tego, że - jeśli parametry są szacowane na podstawie maksymalnego prawdopodobieństwa na podstawie skumulowanych danych - tracisz 1 df na szacowany parametr (problem pochodzi z czasów Fishera i Karla Pearsona) - ale nie pamiętam czytając cokolwiek na temat znajdowania samych granic bin na podstawie danych. (Jeśli oszacujesz je na podstawie niepowiązanych danych, wówczas z binami rozkład statystyki testowej leży gdzieś pomiędzy a a .)
Czy ten oparty na danych wybór pojemników ma istotny wpływ na poziom istotności lub moc? Czy są jakieś podejścia, które mają większe znaczenie niż inne? Jeśli jest duży efekt, czy jest to coś, co odchodzi w dużych próbkach?
Jeśli ma to znaczący wpływ, wydaje się, że zastosowanie testu chi-kwadrat, gdy parametry są nieznane, jest prawie bezużyteczne w wielu przypadkach (pomimo tego, że wciąż zaleca się sporo tekstów), chyba że masz dobry -priori oszacowanie parametru.
Przydatna byłaby dyskusja na temat zagadnień lub wskazówek do odniesień (najlepiej z podaniem ich wniosków).
Edytuj, prawie na bok do głównego pytania:
Przyszło mi do głowy, że istnieją potencjalne rozwiązania dla konkretnego przypadku wykładniczego * (i mundur się nad tym zastanawia), ale nadal interesuje mnie bardziej ogólny problem wpływu granic granicznych.
* Na przykład dla wykładniczej można użyć najmniejszej obserwacji (powiedzmy, że jest równa ), aby uzyskać bardzo przybliżone wyobrażenie o tym, gdzie umieścić pojemniki (ponieważ najmniejsza obserwacja jest wykładnicza ze średnią ), i następnie przetestuj pozostałe różnice ( ) pod kątem wykładniczości. Oczywiście może to dać bardzo słabe oszacowanie , a zatem złe wybory bin, chociaż przypuszczam, że można użyć argumentu rekurencyjnie, aby wziąć najniższe dwie lub trzy obserwacje, z których można wybrać rozsądne pojemniki, a następnie przetestować różnice pozostałe obserwacje powyżej największej z tych statystyk dotyczących najmniejszego rzędu wykładniczej)