Ważne jest odpowiednie sformułowanie pytania i przyjęcie użytecznego koncepcyjnego modelu wyników.
Pytanie
Potencjalne progi oszustwa, takie jak 55, 65 i 85, są znane z góry niezależnie od danych: nie trzeba ich określać na podstawie danych. (Dlatego nie jest to ani problem wykrywania wartości odstających, ani problem dopasowania rozkładu). Test powinien ocenić dowody, że niektóre (nie wszystkie) wyniki tylko poniżej tych progów zostały przesunięte do tych progów (lub, być może, nieco powyżej tych progów).
Model koncepcyjny
W przypadku modelu koncepcyjnego kluczowe jest zrozumienie, że wyniki prawdopodobnie nie będą miały rozkładu normalnego (ani żadnego innego łatwo parametryzowanego rozkładu). Jest to całkowicie jasne w opublikowanym przykładzie i we wszystkich innych przykładach z oryginalnego raportu. Te wyniki stanowią mieszankę szkół; nawet jeśli dystrybucja w jakiejkolwiek szkole była normalna (nie jest), mieszanina prawdopodobnie nie będzie normalna.
Proste podejście akceptuje fakt, że istnieje prawdziwy rozkład wyników: ten, który zostałby zgłoszony, z wyjątkiem tej szczególnej formy oszukiwania. Jest to zatem ustawienie nieparametryczne. To wydaje się zbyt szerokie, ale istnieją pewne cechy rozkładu wyników, które można przewidzieć lub zaobserwować w rzeczywistych danych:
Liczby wyników , oraz będą ściśle skorelowane, .i i + 1 1 ≤ i ≤ 99i−1ii+11≤i≤99
Będą różnice w tych liczbach wokół jakiejś wyidealizowanej gładkiej wersji rozkładu wyników. Te zmiany będą zwykle miały rozmiar równy pierwiastkowi kwadratowemu zliczenia.
ti≥tic(i)δ(t−i)c(i)t(i)
δ(i)i=1,2,…
tδ(1)=0δ0δ(1)>0
Konstruowanie testu
c′(i)=c(i+1)−c(i)ittt+1
c′′(i)=c′(i+1)−c′(i)=c(i+2)−2c(i+1)+c(i),
ponieważ przy połączy to duży ujemny spadek z ujemnym dużym dodatnim wzrostem , zwiększając w ten sposób efekt oszukiwania .i=t−1c(t+1)−c(t)c(t)−c(t−1)
Mam zamiar postawić hipotezę - i można to sprawdzić - że szeregowa korelacja zliczeń w pobliżu progu jest dość mała. (Korelacja szeregowa gdzie indziej nie ma znaczenia.) Oznacza to, że wariancja wynosi okołoc′′(t−1)=c(t+1)−2c(t)+c(t−1)
var(c′′(t−1))≈var(c(t+1))+(−2)2var(c(t))+var(c(t−1)).
Wcześniej zasugerowałem, że dla wszystkich (coś, co można również sprawdzić). Skądvar(c(i))≈c(i)i
z=c′′(t−1)/c(t+1)+4c(t)+c(t−1)−−−−−−−−−−−−−−−−−−−−√
powinien mieć w przybliżeniu wariancję jednostkową. W przypadku populacji o dużej liczbie punktów (opublikowana wygląda na około 20 000) możemy również spodziewać się rozkładu normalnego . Ponieważ oczekujemy, że wysoce ujemna wartość będzie wskazywać na wzorzec oszukiwania, z łatwością uzyskujemy test rozmiaru : writing dla cdf standardowego rozkładu normalnego, odrzucamy hipotezę o braku oszustwa na progu gdy .c′′(t−1)αΦtΦ(z)<α
Przykład
Weźmy na przykład ten zestaw prawdziwych wyników testu, narysowanych na podstawie mieszaniny trzech rozkładów normalnych:
Do tego zastosowałem harmonogram oszustwa na progu zdefiniowanym przez . To skupia prawie wszystkie oszustwa na jednym lub dwóch wynikach bezpośrednio poniżej 65:t=65δ(i)=exp(−2i)
Aby zrozumieć, co robi test, obliczyłem dla każdego wyniku, a nie tylko , i nakreśliłem go w stosunku do wyniku:zt
(W rzeczywistości, aby uniknąć problemów z małymi liczbami, najpierw dodałem 1 do każdej liczby od 0 do 100, aby obliczyć mianownik .)z
Wahania w pobliżu 65 są widoczne, podobnie jak tendencja do wszystkich innych wahań wielkości około 1, zgodnie z założeniami tego testu. Statystyka testu wynosi przy odpowiedniej wartości p , co jest niezwykle znaczącym wynikiem. Porównanie wizualne z liczbą w samym pytaniu sugeruje, że ten test zwróciłby wartość p co najmniej tak małą.z=−4.19Φ(z)=0.0000136
(Należy jednak pamiętać, że sam test nie wykorzystuje tego wykresu, który pokazano w celu zilustrowania pomysłów. Test sprawdza tylko wykreśloną wartość na progu, nigdzie indziej. Niemniej jednak dobrą praktyką byłoby tworzenie takiego wykresu aby potwierdzić, że statystyki testowe naprawdę wyodrębniają oczekiwane progi jako loci oszukiwania i że wszystkie inne wyniki nie podlegają takim zmianom. Tutaj widzimy, że przy wszystkich innych wynikach występują wahania między około -2 a 2, ale rzadko Zwróć też uwagę, że tak naprawdę nie trzeba obliczać odchylenia standardowego wartości na tym wykresie, aby obliczyć , unikając w ten sposób problemów związanych z efektami oszustwa zwiększającymi fluktuacje w wielu lokalizacjach.)z
Przy stosowaniu tego testu do wielu progów rozsądne byłoby dopasowanie wielkości testu Bonferroniego. Dobrym pomysłem byłoby również dodatkowe dostosowanie w przypadku zastosowania do wielu testów jednocześnie.
Ocena
Tej procedury nie można poważnie zaproponować do użycia, dopóki nie zostanie przetestowana na rzeczywistych danych. Dobrym sposobem byłoby zebranie ocen za jeden test i zastosowanie niekrytycznej oceny za test jako wartości progowej. Przypuszczalnie taki próg nie był przedmiotem tej formy oszukiwania. Symuluj oszustwo zgodnie z tym modelem koncepcyjnym i badaj symulowany rozkład . Wskazuje to (a) czy wartości p są dokładne i (b) moc testu do wskazania symulowanej formy oszukiwania. Rzeczywiście, można zastosować takie badanie symulacyjne na samych danych, które ocenia się, zapewniając niezwykle skuteczny sposób sprawdzenia, czy test jest odpowiedni i jaka jest jego rzeczywista moc. Ponieważ statystyki testowezz jest tak proste, że symulacje będą wykonalne i szybkie do wykonania.