Próbuję zautomatyzować wykrywanie wartości odstających w szeregach czasowych i użyłem modyfikacji rozwiązania zaproponowanego przez Roba Hyndmana tutaj .
Powiedzmy, że mierzę codzienne wizyty na stronie z różnych krajów. W niektórych krajach, w których codzienne wizyty to kilka setek lub tysięcy, moja metoda wydaje się działać rozsądnie.
Jednak w przypadkach, gdy kraj prowadzi tylko 1 lub 2 wizyty dziennie, limity algorytmu są bardzo wąskie (np. 1 ± 0,001) i dlatego te 2 wizyty są uważane za wartości odstające. Jak automatycznie wykryć takie przypadki i jak je traktować, aby zidentyfikować wartości odstające? Nie chciałbym ustawiać ręcznego progu, powiedzmy, 100 wizyt dziennie.
Dziękuję Ci!