Za pomocą bootstrap obliczam wartości p testów istotności, stosując dwie metody:
- ponowne próbkowanie w ramach hipotezy zerowej i liczenie wyników co najmniej tak ekstremalnych, jak wynik pochodzący z pierwotnych danych
- ponowne próbkowanie w ramach alternatywnej hipotezy i liczenie wyników co najmniej tak odległych od pierwotnego wyniku, jak wartość odpowiadająca hipotezie zerowej
Uważam, że 1 st podejście jest całkowicie poprawna, ponieważ jest zgodna z definicją wartości ap. Nie jestem pewien co do drugiego, ale zwykle daje bardzo podobne wyniki i przypomina mi test Walda.
Czy mam rację? Czy obie metody są prawidłowe? Czy są identyczne (dla dużych próbek)?
Przykłady dwóch metod (zmiany po pytaniach DWina i odpowiedzi Erika):
Przykład 1. Stwórzmy test ładowania początkowego podobny do testu dwóch próbek T. Metoda 1 ponownie spróbuje z jednej próbki (uzyskanej przez połączenie dwóch oryginalnych). Metoda 2 przeprowadzi ponowne próbkowanie obu próbek niezależnie.Przykład 2. Stwórzmy test ładowania początkowego korelacji między x₁… xₐ i y₁… yₐ. Metoda 1 zakłada brak korelacji i ponowne próbkowanie, dopuszczając pary (xₑ, yₔ), gdzie e e ə. Metoda 2 skompiluje próbkę ładowania początkowego par oryginalnych (x, y).
Przykład 3. Stwórzmy test ładowania początkowego, aby sprawdzić, czy moneta jest uczciwa. Metoda 1 utworzy losowe próbki, ustawiając Pr (głowa) = Pr (ogon) = ½. Metoda 2 ponownie spróbuje próbki wartości eksperymentalnej głowy / ogona i porówna proporcje do ½.