Muszę od razu wyjaśnić, że jestem praktykującym programistą, a nie statystykiem, a moja klasa statystyk z college'u była bardzo dawno temu…
To powiedziawszy, chciałbym wiedzieć, czy istnieje metoda gromadzenia zestawu statystyk opisowych, które można by następnie wykorzystać do stworzenia wykresu pudełkowego, który nie pociąga za sobą przechowywania wielu pojedynczych próbek?
Usiłuję utworzyć graficzne podsumowanie czasów obsługi kolejek w złożonym procesie składającym się z wielu kolejek. W przeszłości korzystałem z pakietu o nazwie tnftools, który pozwalał na gromadzenie dużych próbek, a następnie przetwarzanie ich w ładny wykres czasów odpowiedzi i wartości odstających… Ale tnftools nie są dostępne dla mojej obecnej platformy.
Idealnie chciałbym móc gromadzić zestaw statystyk opisowych „w locie” w trakcie trwania procesu, a następnie wyodrębniać dane do analizy na żądanie. Ale nie mogę po prostu pozwolić, aby proces gromadził próbki, ponieważ zaangażowana w to pamięć / operacja miałaby niedopuszczalny wpływ na wydajność systemu.