Istotne statystycznie vs. niezależne / zależne

Jaka jest różnica między posiadaniem czegoś istotnego statystycznie (np. Różnica między dwiema próbkami) a stwierdzeniem, czy grupa liczb jest niezależna lub zależna.

statistical-significance independence

— Elpezmuerto
źródło

Istotność w teście niezależnym dla próbek oznacza po prostu, że prawdopodobieństwo (jeśli zerowe były prawdziwe) próbkowania średniej różnicy tak ekstremalnej, jak średnia różnica, z której rzeczywiście pobrałeś próbkę, jest mniejsza niż 0,05.

Jest to całkowicie niezwiązane z zależnymi / niezależnymi. „Zależny” oznacza, że rozkład niektórych indywidualnych obserwacji jest związany z rozkładem innych, na przykład A) są to te same osoby, które przeprowadzają ten sam test drugi raz, B) ludzie w każdej grupie są dopasowani do jakiejś zmiennej przedtestowej, C) osoby w dwóch grupach są spokrewnione (tj. Rodzina). „Niezależny” oznacza, że nie ma takiego połączenia.

— Brian
źródło

Należy również zauważyć, że p = 0,05 jest nieco arbitralnym progiem. Jeśli uważasz, że 1:20 jest zbyt dużą szansą na fałszywie pozytywny wynik, twoje p powinno być niższe.

— naught101

Po co zatrzymywać się na $t$ -testy?

Można pomyśleć, że dwie zmienne są nieskorelowane jako dwa wektory ortogonalne, dokładnie tak jak $x$ i $y$ osie w dwuwymiarowym kartezjańskim układzie współrzędnych.

Gdy którykolwiek z dwóch wektorów, powiedzmy $\mathbf{x}$ i $\mathbf{y}$ jest skorelowany z drugim, będzie pewna część x, która może być rzutowana na y i odwrotnie. Mając to na uwadze, dość łatwo to zauważyć, ponieważ,

\begin{aligned} ⟨ x, y ⟩ & = ‖ x ‖ ‖ y ‖ \cos (θ) \\ \frac{⟨ x, y ⟩}{‖ x ‖ ‖ y ‖} & = \cos (θ) = r \end{aligned}

$\begin{align*} \left<\mathbf{x},\mathbf{y}\right>&=\|x\|\|y\|\cos\left(\theta\right)\\ \frac{\left<\mathbf{x},\mathbf{y}\right>}{\|x\|\|y\|}&=\cos\left(\theta\right)=r \end{align*}$

Gdzie jest współczynnikiem korelacji Pearsona, a jest iloczynem wewnętrznym argumentów. Kiedy się tego nauczyłem, byłem całkowicie oszołomiony tym, jak geometrycznie prosty jest pomysł korelacji. I to zdecydowanie nie jest jedyny sposób pomiaru korelacji między dwiema (lub więcej) zmiennymi. $r$ $\left<\cdot,\cdot\right>$

Testowanie istotności to inna gra w piłkę. Często chcemy wiedzieć, o ile dwie (lub więcej) grupy różnią się w zależności od zmiennej wynikowej w wyniku pewnych manipulacji przeprowadzonych na tych grupach. Jak powiedział Brian, chcesz wiedzieć, czy dwie grupy pochodzą z tego samego rozkładu, dlatego obliczasz prawdopodobieństwo próbkowania średniej różnicy (skalowanej przez standardowy błąd średniej) uzyskanej z eksperymentu, biorąc pod uwagę hipotezę zerową (nie ma znaczącej różnicy w środkach) jest prawdą. W badaniach behawioralnych (i często gdzie indziej), jeśli prawdopodobieństwo to jest mniejsze niż 0,05, możesz dojść do wniosku, że różnica między dwoma (lub więcej) średnimi jest prawdopodobnie spowodowana twoją manipulacją.

EDYCJA : Dilip Sarwate wskazał, że dwie nieskorelowane zmienne mogą być statystycznie zależne, więc wyjąłem pierwszą część. Dziękuję za to.

— Phillip Cloud
źródło

Wow, moje tło matematyczne jest znacznie bardziej zaawansowane niż moje statystyki. Uważam, że to naprawdę intuicyjny sposób zrozumienia r Pearsona. Ta odpowiedź jest bardzo pomocna, dzięki!

— naught101

Zwłaszcza koncepcja, że kowariancja jest tylko produktem wewnętrznym!

— naught101

-1 dla „Można pomyśleć o dwóch zmiennych niezależnych (czasami nazywanych również nieskorelowanymi)” Niezależność nie jest tym samym, co bycie nieskorelowanym; nieskorelowane zmienne losowe mogą być bardzo zależne.

— Dilip Sarwate

OK, dziękuję za naprawienie problemu. Cofam swój głos oddolny.

— Dilip Sarwate