Ok, oto moja pierwsza próba. Doceniamy dokładną analizę i komentarze!
Hipotezy z dwiema próbkami
Jeśli możemy sformułować dwustronne testy hipotez Kołmogorowa-Smirnowa z hipotezami zerowymi i naprzemiennymi wzdłuż tych linii:
H 0 : F Y ( t ) ≥ F X ( t ) i0: FY(t)≥FX(t)
H A : F Y ( t ) < F X ( t ) , dla co najmniej jednego t , gdzie:A: FY(t)<FX(t)t
D−=|mint(FY(t)−FX(t))|0: FY(t)≥FX(t)
statystyki testu odpowiada H ; i0 : F Y ( t ) ≤ F X ( t )re+= | maxt( F.Y( t ) - FX( t ) ) |0: FY( t ) ≤ F.X( t )
F X ( t ) Y XfaY( t ) i to empiryczne CDF próbek i ,FX(t)YX
wówczas rozsądne jest stworzenie ogólnej hipotezy przedziałowej dla testu równoważności według tych linii (zakładając, że przedział równoważności jest obecnie symetryczny):
H i−0: |FY(t)−FX(t)|≥Δ
H , dla co najmniej jednego .t−A: |FY(t)−FX(t)|<Δt
Przekładałoby się to na konkretne dwie jednostronne „negatywistyczne” hipotezy zerowe w celu przetestowania równoważności (te dwie hipotezy przyjmują tę samą formę, ponieważ zarówno i są ściśle nieujemne): D -D+D−
H , lub−01: D+≥Δ
H .−02: D−≥Δ
Odrzucenie zarówno H i H doprowadziłoby do wniosku, że . Oczywiście przedział równoważności nie musi być symetryczny, a i można zastąpić (dolny) i (górny) dla odpowiednich jednostronnych hipotez zerowych.- 02 -Δ<FY(t)-FX(t)<Δ-ΔΔΔ2Δ1−01 −02−Δ<FY(t)−FX(t)<Δ−ΔΔΔ2Δ1
Statystyka testu (zaktualizowana: Delta jest poza znakiem wartości bezwzględnej)
Statystyka testu i (pozostawiając domyślnie i ) odpowiadają odpowiednio H i H i są to: D - 2 n Y n X - 01 - 02D+1D−2nYnX−01−02
D+1=Δ−D+=Δ−|maxt[(FY(t)−FX(t))]|, i
D−2=Δ−D−=Δ−|mint[(FY(t)−FX(t))]|
Próg równoważności / trafności
Odstęp - lub , jeśli zastosowano asymetryczny przedział równoważności - jest wyrażany w jednostkach i lub wielkość różnych prawdopodobieństw. Gdy i zbliżają się do nieskończoności, CDF z lub dla zbliża się do dla , a dla :[ Δ 2 , Δ 1 ] D + D - n Y n X D + D - n Y , n X 0 t < 0 t ≥ 0[−Δ,Δ][Δ2,Δ1]D+D−nYnXD+D−nY,nX0t<0t≥0
limnY,nX→∞p+=P(nYnXnY+nX−−−−−−−−√D+≤t)=1−e−2t2
Wydaje mi się więc, że plik PDF dla skalowanej wielkości próby (lub skalowanej wielkości próby ) musi mieć wartość dla , a dla : D - 0 t < 0 t ≥ 0D+D−0t<0t≥0
f(t)=1−e−2t2ddt=4te−2t2
Glen_b wskazuje, że jest to rozkład Rayleigha z . Tak więc funkcja kwantylu dużej próbki dla skalowanych wielkości próbek i to: D+D-σ=12D+D−
CDF−1=Q(p)=−ln(1−p)2−−−−−−−−−−√
a liberalny wybór może być wartością krytyczną , a bardziej rygorystyczny wybór wartością krytyczną .ΔQα+σ/2=Qα+14Qα+σ/4=Qα+18