Jakie są najlepsze metody dopasowania „trybu” danych próbkowanych z ciągłego rozkładu?
Ponieważ tryb jest technicznie niezdefiniowany (prawda?) Dla ciągłej dystrybucji, naprawdę pytam „jak znaleźć najczęstszą wartość”?
Jeśli przyjmiesz, że rozkład rodzica jest gaussowski, możesz bin binować dane i stwierdzić, że tryb jest lokalizacją bin z największą liczbą. Jak jednak określić rozmiar pojemnika? Czy są dostępne solidne wdrożenia? (tj. odporny na wartości odstające). Używam python
/ scipy
/ numpy
, ale prawdopodobnie potrafię tłumaczyć R
bez większych trudności.