Chciałbym przetestować niektóre z moich pomysłów, które moim zdaniem są lepsze niż cokolwiek, co widziałem. Mogę się mylić, ale chciałbym przetestować swoje pomysły i rozwiać moje wątpliwości bardziej pewnymi spostrzeżeniami.
To, o czym myślałem, to:
- Analitycznie zdefiniuj zestaw rozkładów. Niektóre z nich są łatwe, takie jak Gaussa, mundur lub Tophat. Ale niektóre z nich muszą być trudne i wymagające, takie jak dystrybucja Simpsonów.
- Zaimplementuj oprogramowanie oparte na tych analitycznych rozkładach i użyj ich do wygenerowania niektórych próbek.
- Ponieważ rozkłady są zdefiniowane analitycznie, już - z definicji - znam ich prawdziwe pliki PDF. To jest świetne.
- Następnie przetestuję następujące metody oceny PDF na powyższych próbkach:
- Istniejące metody szacowania plików PDF (takie jak KDE z różnymi jądrami i przepustowością).
- Mój własny pomysł, który moim zdaniem warto spróbować.
- Następnie zmierzę błąd szacunków w stosunku do prawdziwych plików PDF.
- Wtedy lepiej będę wiedział, która z metod oceny PDF jest dobra.
Moje pytania to:
- P1: Czy są jakieś ulepszenia w stosunku do mojego planu powyżej?
- P2: Trudno mi analitycznie zdefiniować wiele prawdziwych plików PDF. Czy istnieje już obszerna lista wielu analitycznie zdefiniowanych prawdziwych plików PDF o różnych trudnościach (w tym bardzo trudnych), które mogę tutaj ponownie wykorzystać?