Zamierzam to przebudować na podstawie doświadczenia w sprawach dotyczących dyskryminacji. Zdecydowanie mogę ustalić, skąd wzięły się wartości „jeden na 741” itd . Jednak w tłumaczeniu zaginęło tak wiele informacji, że reszta mojej rekonstrukcji polega na tym, że widziałam, jak ludzie robią statystyki w salach rozpraw. Mogę tylko zgadywać na podstawie niektórych szczegółów.
0.050.01
Eksperci statystyczni dla powodów często próbują sformułować swoje wyniki w tych znanych terminach. Niektórzy eksperci przeprowadzają test statystyczny, w którym hipoteza zerowa wyraża „brak negatywnego wpływu”, zakładając, że decyzje o zatrudnieniu były czysto losowe i nie podlegały żadnym innym cechom pracowników. (Niezależnie od tego, czy jest to jedno-, czy dwustronna alternatywa, może zależeć od eksperta i okoliczności.) Następnie przekształcają wartość p tego testu na szereg „odchyleń standardowych”, odnosząc ją do standardowego rozkładu normalnego - - nawet jeśli standardowa Normalna nie ma znaczenia dla pierwotnego testu. Na tym rondzie mają nadzieję, że jasno przekażą swoje wnioski sędziemu.
Preferowanym testem danych, które można podsumować w tabelach awaryjnych, jest Dokładny test Fishera. Występowanie „Dokładnego” w jego nazwie jest szczególnie przyjemne dla powodów, ponieważ wiąże się z ustaleniem statystycznym, które zostało dokonane bezbłędnie (cokolwiek to może być!).
Oto moja (spekulacyjna rekonstrukcja) obliczeń Departamentu Pracy.
χ2
Przekształcili jego wartość p na normalny wynik Z („liczba odchyleń standardowych”).
Są one zaokrąglone wynik Z do najbliższej liczby całkowitej „przekracza trzy odchylenia standardowe”, „przekracza pięć odchyleń standardowych” i „przekracza sześciu odchyleń standardowych”. (Ponieważ niektóre z tych wyników Z zaokrąglały w górę do bardziej standardowych odchyleń, nie mogę uzasadnić „przekroczeń”; wszystko, co mogę zrobić, to zacytować to.)
W skardze te całkowite wyniki Z zostały przeliczone z powrotem na wartości p! Ponownie zastosowano standardowy rozkład normalny.
Te wartości p są opisane (prawdopodobnie w sposób wprowadzający w błąd) jako „prawdopodobieństwo, że ten wynik wystąpił przypadkowo”.
1/12801/5650001/5800000073011601307301160130−3.16−4.64−5.521/7411/35000001/1000000000
Oto R
kod używany do wykonania tych obliczeń.
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))