Załóżmy, że wykonanie badania ze wspólnego podziału i . Jak przetestować hipotezę, że i są niezależne ?X Y X Y
Nie przyjmuje się żadnych założeń dotyczących wspólnych lub marginalnych praw rozkładu i (co najmniej całej wspólnej normalności, ponieważ w tym przypadku niezależność jest identyczna z korelacją równą ).Y 0
Nie zakłada się natury możliwej relacji między i ; może być nieliniowy, więc zmienne są nieskorelowane ( ), ale wysoce współzależne ( ).Y r = 0 I = H
Widzę dwa podejścia:
Bin obie zmienne i wykorzystanie dokładny test Fishera lub G-test .
- Pro: użyj sprawdzonych testów statystycznych
- Con: zależy od binowania
Oszacowanie zależności od i : (to jest do niezależnego i i , gdy całkowicie określenia siebie).Y I ( X ; Y )XY1
- Pro: tworzy liczbę o wyraźnym znaczeniu teoretycznym
- Con: zależy od przybliżonego obliczenia entropii (tj. Binowania ponownie)
Czy te podejścia mają sens?
Jakie inne metody stosują ludzie?