Jakie są najlepsze metody dopasowania „trybu” danych próbkowanych z ciągłego rozkładu?
Ponieważ tryb jest technicznie niezdefiniowany (prawda?) Dla ciągłej dystrybucji, naprawdę pytam „jak znaleźć najczęstszą wartość”?
Jeśli przyjmiesz, że rozkład rodzica jest gaussowski, możesz bin binować dane i stwierdzić, że tryb jest lokalizacją bin z największą liczbą. Jak jednak określić rozmiar pojemnika? Czy są dostępne solidne wdrożenia? (tj. odporny na wartości odstające). Używam python/ scipy/ numpy, ale prawdopodobnie potrafię tłumaczyć Rbez większych trudności.