Istnieje koncepcja specjalnie do porównywania rozkładów, która powinna być lepiej znana: rozkład względny.
Y0, Yfa0, F.fa0
R = F.0( Y)
RYY0fa0( Y0) ma zawsze rozkład równomierny (przy ciągłych zmiennych losowych, jeśli zmienne losowe są dyskretne, będzie to przybliżone).
Spójrzmy na przykład. Witryna http://www.math.hope.edu/swanson/data/cellphone.txt zawiera dane dotyczące długości ostatniego połączenia telefonicznego studentów i studentek. Wyjaśnijmy rozkład długości połączeń telefonicznych dla studentów płci męskiej, z referencją dla studentek.
xT. (cokolwiek to jest, jego wartość nie jest pokazana) tak, że 20% połączeń kobiet było krótszych (lub równych) do tego względna gęstość dla mężczyzn w tym przedziale waha się między około 1,3 a 1,4. Jeśli przybliżymy (mentalnie z wykresu) średnią gęstość względną w tym przedziale jako 1,35, widzimy, że odsetek mężczyzn w tym przedziale jest o około 35% wyższy niż odsetek kobiet. To odpowiada 27% mężczyzn w tym przedziale czasowym.
Możemy również wykonać ten sam wykres z punktowymi przedziałami ufności wokół krzywej gęstości względnej:
Szerokie pasma ufności w tym przypadku odzwierciedlają niewielki rozmiar próbki.
Jest książka o tej metodzie: Handcock
Kod R dla wykresu jest tutaj:
phone <- read.table(file="phone.txt", header=TRUE)
library(reldist)
men <- phone[, 1]
women <- phone[, 3]
reldist(men, women)
title("length of mens last phonecall with women as reference")
Dla ostatniej działki zmień na:
reldist(men, women, ci=TRUE)
title("length of mens last phonecall with women as reference\nwith pointwise confidence interval (95%)")
Należy zauważyć, że wykresy są tworzone przy użyciu oszacowania gęstości jądra, przy czym stopień gładkości wybiera się za pomocą gcv (uogólniona walidacja krzyżowa).
Q0fa0rRyr
sol( r ) = f( Q0( r ) )fa0( Q0( r ) )
g( r ) = f( yr)fa0( yr). Pokazuje to, że gęstość względną można interpretować jako stosunek gęstości. Ale w pierwszej formie z argumentami
r, jest to również gęstość sama w sobie, integrująca się z jedną w przedziale
( 0 , 1 ). To dobry punkt wyjścia do wnioskowania.
hist
; wygładzone gęstościdensity
; Wykresy QQqqplot
; wykresy łodyg i liści (nieco starożytne)stem
. Ponadto test Kołmogorowa-Smirnowa może być dobrym uzupełnieniemks.test
.