Wilk, MB i Gnanadesikan, R. 1968. Metody kreślenia prawdopodobieństwa do analizy danych.
Biometrika 55: 1-17. Jstor link, jeśli masz dostęp
Ten artykuł ma w chwili pisania prawie 50 lat, ale wciąż wydaje się świeży i innowacyjny. Korzystając z bogatej gamy interesujących i istotnych przykładów, autorzy ujednolicają i rozszerzają różnorodne pomysły dotyczące kreślenia i porównywania rozkładów za pomocą schematów QQ (kwantyl-kwantyl) i PP (prawdopodobieństwo-prawdopodobieństwo). Rozkłady tutaj oznaczają zasadniczo wszelkie zbiory danych lub liczb (reszty, kontrasty itp.) Powstałe w ich analizach.
Poszczególne wersje tych wykresów sięgają kilku dziesięcioleci, oczywiście normalne prawdopodobieństwo lub wykresy normalnych wyników. które są w tych terminach wykresami kwantylowo-kwantylowymi, a mianowicie wykresami zaobserwowanych kwantyli w porównaniu z oczekiwanymi lub teoretycznymi kwantylami z próbki tej samej wielkości z rozkładu normalnego (Gaussa). Ale autorzy pokazują, skromnie, ale pewnie, że te same pomysły można łatwo rozszerzyć - i praktycznie za pomocą nowoczesnego komputera - do badania innych rodzajów kwantyli i automatycznego rysowania wyników.
Autorzy, wówczas obaj w Bell Telephone Laboratories, cieszyli się najnowocześniejszymi urządzeniami obliczeniowymi, a nawet wiele uniwersytetów i instytucji badawczych zajęło im dekadę. Nawet teraz pomysły zawarte w tym dokumencie zasługują na szersze zastosowanie niż są. To rzadki tekst wprowadzający lub kurs, który zawiera którekolwiek z tych pomysłów poza normalnym spisem QQ. Histogramy i wykresy pudełkowe (każdy często bardzo użyteczny, ale mimo to każdy niewygodny i ograniczony na kilka sposobów) pozostają głównymi zszywkami po wprowadzeniu wykresów dystrybucji.
Na poziomie osobistym, mimo że główne idee tego artykułu były znane przez większą część mojej kariery, lubię go czytać co kilka lat. Jednym z dobrych powodów jest przyjemność ze sposobu, w jaki autorzy przedstawiają proste, ale potężne pomysły z dobrym skutkiem na poważnych przykładach. Innym dobrym powodem jest sposób, w jaki artykuł, który jest zwięźle napisany, bez najmniejszego śladu bombasta, wskazuje na rozszerzenie głównych idei. Nie raz odkryłem zwroty akcji dotyczące głównych pomysłów zawartych w podpowiedziach i dalszych komentarzach.
To nie jest tylko praca dla osób szczególnie zainteresowanych grafiką statystyczną, choć moim zdaniem powinna ona obejmować wszystkich zainteresowanych statystykami dowolnego rodzaju. Promuje sposoby myślenia o rozkładach, które są praktycznie pomocne w rozwijaniu umiejętności i spostrzeżeń statystycznych.