Jaka jest różnica między posiadaniem czegoś istotnego statystycznie (np. Różnica między dwiema próbkami) a stwierdzeniem, czy grupa liczb jest niezależna lub zależna.
Jaka jest różnica między posiadaniem czegoś istotnego statystycznie (np. Różnica między dwiema próbkami) a stwierdzeniem, czy grupa liczb jest niezależna lub zależna.
Odpowiedzi:
Istotność w teście niezależnym dla próbek oznacza po prostu, że prawdopodobieństwo (jeśli zerowe były prawdziwe) próbkowania średniej różnicy tak ekstremalnej, jak średnia różnica, z której rzeczywiście pobrałeś próbkę, jest mniejsza niż 0,05.
Jest to całkowicie niezwiązane z zależnymi / niezależnymi. „Zależny” oznacza, że rozkład niektórych indywidualnych obserwacji jest związany z rozkładem innych, na przykład A) są to te same osoby, które przeprowadzają ten sam test drugi raz, B) ludzie w każdej grupie są dopasowani do jakiejś zmiennej przedtestowej, C) osoby w dwóch grupach są spokrewnione (tj. Rodzina). „Niezależny” oznacza, że nie ma takiego połączenia.
Po co zatrzymywać się na -testy?
Można pomyśleć, że dwie zmienne są nieskorelowane jako dwa wektory ortogonalne, dokładnie tak jak i osie w dwuwymiarowym kartezjańskim układzie współrzędnych.
Gdy którykolwiek z dwóch wektorów, powiedzmy i jest skorelowany z drugim, będzie pewna część x, która może być rzutowana na y i odwrotnie. Mając to na uwadze, dość łatwo to zauważyć, ponieważ,
Gdzie jest współczynnikiem korelacji Pearsona, a jest iloczynem wewnętrznym argumentów. Kiedy się tego nauczyłem, byłem całkowicie oszołomiony tym, jak geometrycznie prosty jest pomysł korelacji. I to zdecydowanie nie jest jedyny sposób pomiaru korelacji między dwiema (lub więcej) zmiennymi.
Testowanie istotności to inna gra w piłkę. Często chcemy wiedzieć, o ile dwie (lub więcej) grupy różnią się w zależności od zmiennej wynikowej w wyniku pewnych manipulacji przeprowadzonych na tych grupach. Jak powiedział Brian, chcesz wiedzieć, czy dwie grupy pochodzą z tego samego rozkładu, dlatego obliczasz prawdopodobieństwo próbkowania średniej różnicy (skalowanej przez standardowy błąd średniej) uzyskanej z eksperymentu, biorąc pod uwagę hipotezę zerową (nie ma znaczącej różnicy w środkach) jest prawdą. W badaniach behawioralnych (i często gdzie indziej), jeśli prawdopodobieństwo to jest mniejsze niż 0,05, możesz dojść do wniosku, że różnica między dwoma (lub więcej) średnimi jest prawdopodobnie spowodowana twoją manipulacją.
EDYCJA : Dilip Sarwate wskazał, że dwie nieskorelowane zmienne mogą być statystycznie zależne, więc wyjąłem pierwszą część. Dziękuję za to.