Mój tekst nieparametryczny, Practical Nonparametric Statistics , często podaje czyste formuły dla oczekiwań, wariancji, statystyk testowych itp., Ale zawiera zastrzeżenie, że działa to tylko wtedy, gdy zignorujemy więzi. Przy obliczaniu statystyki U Manna-Whitneya zaleca się, abyś wyrzucał związane pary podczas porównywania większych.
Rozumiem, że więzi tak naprawdę nie mówią nam wiele o tym, która populacja jest większa (jeśli to nas interesuje), ponieważ żadna grupa nie jest większa od drugiej, ale nie wydaje się, żeby miało to znaczenie przy opracowywaniu rozkładów asymptotycznych.
Dlaczego więc takie rozterki wiążą się z niektórymi nieparametrycznymi procedurami? Czy istnieje sposób na wydobycie użytecznych informacji z więzi, zamiast po prostu ich wyrzucić?
EDYCJA: W odniesieniu do komentarza @ whuber ponownie sprawdziłem źródła, a niektóre procedury używają średniej rang zamiast całkowicie upuszczać powiązane wartości. Chociaż wydaje się to rozsądniejsze w odniesieniu do zatrzymywania informacji, wydaje mi się również, że brakuje jej rygoru. Duch pytania pozostaje jednak niezmienny.