Czy istnieje prosta testowa wersja równoważności testu Kołmogorowa – Smirnowa?


13

Czy w ramach testu Kołmogorowa – Smirnowa sformułowano dwa jednostronne testy równoważności (TOST) w celu przetestowania negatywnej hipotezy zerowej, że dwie rozkłady różnią się co najmniej o poziom określony przez badacza?

Jeśli nie TOST, to jakaś inna forma testu równoważności?

Nick Stauner mądrze wskazuje, że (powinienem już wiedzieć;), że istnieją inne nieparametryczne testy równoważności TOST dla hipotez zerowych dla równoważności stochastycznej oraz, przy bardziej restrykcyjnych założeniach, dla równoważności mediany.


Odpowiedzi:


9

Ok, oto moja pierwsza próba. Doceniamy dokładną analizę i komentarze!

Hipotezy z dwiema próbkami
Jeśli możemy sformułować dwustronne testy hipotez Kołmogorowa-Smirnowa z hipotezami zerowymi i naprzemiennymi wzdłuż tych linii:

H 0F Y ( t )F X ( t ) i0FY(t)FX(t)

H AF Y ( t ) < F X ( t ) , dla co najmniej jednego t , gdzie:AFY(t)<FX(t)t

  • D=|mint(FY(t)FX(t))|0FY(t)FX(t)

  • statystyki testu odpowiada H ; i0F Y ( t )F X ( t )D+=|maxt(FY(t)FX(t))|0FY(t)FX(t)

  • F X ( t ) Y XFY(t) i to empiryczne CDF próbek i ,FX(t)YX

wówczas rozsądne jest stworzenie ogólnej hipotezy przedziałowej dla testu równoważności według tych linii (zakładając, że przedział równoważności jest obecnie symetryczny):

H i0|FY(t)FX(t)|Δ

H , dla co najmniej jednego .tA|FY(t)FX(t)|<Δt

Przekładałoby się to na konkretne dwie jednostronne „negatywistyczne” hipotezy zerowe w celu przetestowania równoważności (te dwie hipotezy przyjmują tę samą formę, ponieważ zarówno i są ściśle nieujemne): D -D+D

H , lub01D+Δ

H .02DΔ

Odrzucenie zarówno H i H doprowadziłoby do wniosku, że . Oczywiście przedział równoważności nie musi być symetryczny, a i można zastąpić (dolny) i (górny) dla odpowiednich jednostronnych hipotez zerowych.- 02 -Δ<FY(t)-FX(t)<Δ-ΔΔΔ2Δ101 02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

Statystyka testu (zaktualizowana: Delta jest poza znakiem wartości bezwzględnej)
Statystyka testu i (pozostawiając domyślnie i ) odpowiadają odpowiednio H i H i są to: D - 2 n Y n X - 01 - 02D1+D2nYnX0102

D1+=ΔD+=Δ|maxt[(FY(t)FX(t))]|, i

D2=ΔD=Δ|mint[(FY(t)FX(t))]|

Próg równoważności / trafności
Odstęp - lub , jeśli zastosowano asymetryczny przedział równoważności - jest wyrażany w jednostkach i lub wielkość różnych prawdopodobieństw. Gdy i zbliżają się do nieskończoności, CDF z lub dla zbliża się do dla , a dla :[ Δ 2 , Δ 1 ] D + D - n Y n X D + D - n Y , n X 0 t < 0 t 0[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0t<0t0

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF w wysokości $ D ^ {+} $ (lub $ D ^ {-} $)

Wydaje mi się więc, że plik PDF dla skalowanej wielkości próby (lub skalowanej wielkości próby ) musi mieć wartość dla , a dla : D - 0 t < 0 t 0D+D0t<0t0

f(t)=1e2t2ddt=4te2t2

PDF $ D ^ {+} $ (lub $ D ^ {-} $)

Glen_b wskazuje, że jest to rozkład Rayleigha z . Tak więc funkcja kwantylu dużej próbki dla skalowanych wielkości próbek i to: D+D-σ=12D+D

CDF1=Q(p)=ln(1p)2

a liberalny wybór może być wartością krytyczną , a bardziej rygorystyczny wybór wartością krytyczną .ΔQα+σ/2=Qα+14Qα+σ/4=Qα+18


1
W linii, w której przechodzisz z cdf do pdf, myślę, że się pomyliłeś. Niech , więc (nadużywanie notacja), w limicie . Następnie (zwróć uwagę na po ). (zauważ także brakujący znak w wykładniku w linii nad wzięciem pochodnej. Nie jestem też pewien, dlaczego masz tam integralny symbol, ale może coś źle zrozumiałem.)KnY,nX=nYnXnY+nXD+P(K,t)=1e2t2fK(t)=ddt1e2t2=4te2t2t4
Glen_b

2
@stochazesthai i to dwie jednostronne statystyki testowe. Podczas TOST musisz odrzucić obie hipotezy zerowe, do których odnoszą się te statystyki testowe. jest wartością krytyczną z CDF w powyższym wierszu, i gdzie chcesz wpisać dla (np. ). Wybór zależy od tego, jak daleko minę (wartość krytycznego odrzucenia zwykłego starego pozytywisty ), którą musisz przejść, zanim dojdziesz do wniosku, że istotna różnica (np. Liberalna „równoważność” toD1D2Qα11αpQα=ln(1(1α))2ΔQαH014 σ poza ). Qα
Alexis,

2
@stochazesthai (Kontynuacja) Jeśli więc zarówno i , to odrzucasz . D1ΔD2ΔH0
Alexis

2
@stochazesthai Whoops! Powinienem był umieścić cytaty wokół słowa liberalny, a nie zrównoważyć dwa komentarze z powrotem. :)
Alexis

2
@stochazesthai Jeśli , a następnie odrzuć , jeśli , to nie odrzuć . Jeśli , to odrzuć , jeśli , to nie odrzuć . Jeśli odrzucisz zarówno i , a następnie odrzuć , w przeciwnym razie nie odrzucisz . D1ΔH01D1<ΔH01D2ΔH02D2<ΔH02H01H02H0H0
Alexis,

6

Alternatywą dla TOST w testach równoważności jest podejście oparte na przedziale ufności:

Niech oznacza określony margines równoważności i odległość Kołmogorowa-Smirnowa między nieznanymi podstawowymi funkcjami rozkładu.Δ

θ:=supt|FX(t)FY(t)|

Teraz, jeśli 90% przedział ufności dla jest całkowicie w zakresie , możemy być w 95% pewni, że jest wystarczająco bliskie , aby mówić o „równoważności”.θ[Δ,Δ]θ

Nie znając podstawowych rozkładów, wydaje się być beznadziejna wyprowadzić przybliżoną analityczną przedział ufności, więc może trzeba polegać na (bias poprawione) przedziały ufności bootstrap oparciu o resampling z par i . (Nie chcę jednak znaleźć warunków dla ich ważności w tej konkretnej aplikacji ...)YXY


Doskonały. Czy masz wzmiankę o kimś, kto podejmuje o (bootstrap lub w inny sposób)? Dn1,n2
Alexis,

1
Dobra uwaga ... W krótkim tomswebpage.net/images/K-S_test.doc wspomniano o „Podręczniku parametrycznych i nieparametrycznych procedur statystycznych, wydanie piąte autorstwa Davida J. Shechena (27 kwietnia 2011 r.)”. oferować konstrukcję dwóch próbek dla D. Ale w tej chwili nie mam dostępu do tej książki.
Michael M.
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.