Mam pewne dane, które muszę wizualizować i nie jestem pewien, jak najlepiej to zrobić. Mam pewien zestaw elementów podstawowych o odpowiednich częstotliwościach i wyniki O \ w \ {0,1 \} ^ n . Teraz muszę wykreślić, jak dobrze moja metoda „znajduje” (tj. Wynik 1) elementy niskiej częstotliwości. Początkowo miałem po prostu oś x częstotliwości i oś y 0-1 z wykresami punktowymi, ale wyglądało to okropnie (szczególnie przy porównywaniu danych z dwóch metod). Oznacza to, że każdy element q \ w Q ma wynik (0/1) i jest uporządkowany według częstotliwości.F = { f 1 , ⋯ , f n } q ∈ Q
Oto przykład z wynikami jednej metody:
Moim następnym pomysłem było podzielenie danych na przedziały i obliczenie lokalnej czułości w przedziałach, ale problem z tym pomysłem polega na tym, że rozkład częstotliwości niekoniecznie jest jednolity. Jak więc najlepiej wybrać interwały?
Czy ktoś wie o lepszym / bardziej użytecznym sposobie wizualizacji tego rodzaju danych w celu przedstawienia skuteczności znajdowania rzadkich (tj. Bardzo niskiej częstotliwości) przedmiotów?
EDYCJA: Aby być bardziej konkretnym, pokazuję zdolność jakiejś metody do rekonstrukcji sekwencji biologicznych pewnej populacji. W celu walidacji z wykorzystaniem danych symulowanych muszę wykazać zdolność do rekonstrukcji wariantów niezależnie od ich liczebności (częstotliwości). W tym przypadku wizualizuję pominięte i znalezione przedmioty, uporządkowane według częstotliwości. Ten wykres nie będzie zawierała zrekonstruowane warianty, które nie są w .