Trudno mi zaakceptować, że Donald Rubin kiedykolwiek wymyśli prawdziwą cytrynę techniki. Ale takie jest moje postrzeganie BESD [ 1 , 2 , 3 ].
Oryginalny artykuł Rosenthala i Rubina (1982) twierdził, że warto wykazać „jak przekształcić dowolną korelację momentu produktu w taki wyświetlacz [2x2], niezależnie od tego, czy oryginalne dane są ciągłe czy kategoryczne”.
Poniższa tabela pochodzi z pkt. 451 drugiego linku powyżej:
Ta technika wydaje się zawyżać wielkość niemal każdego rozmiaru efektu. Tutaj z oryginalnych danych = .01, ale kiedy „przetłumaczone” na stole 2x2 awaryjnych, zdaje się, że w obliczu znacznie silniejszy efekt. Nie przeczę, że kiedy dane są przekształcane w format kategoryczny w ten sposób, ϕ rzeczywiście = .1, ale czuję, że coś zostało bardzo zniekształcone w tłumaczeniu.
Czy brakuje mi czegoś naprawdę cennego? Mam również wrażenie, że w ciągu ostatnich 10 lat społeczność statystyczna zasadniczo odrzuciła to jako uzasadnioną metodę - czy się mylę?
Równanie do obliczenia, odpowiednio, eksperymentalnego ( ) i kontrolnego ( C ) wskaźnika powodzenia ( s r ), jest po prostu:
i
Odniesienie:
Rosenthal, R., i Rubin, DB (1982). Prosty wyświetlacz ogólnego przeznaczenia wielkości efektu eksperymentalnego. Journal of Educational Psychology, 74 , 166–169.