Nie powiedziałbym, że rośnie zainteresowanie lub debata na temat korzystania z wykresów kołowych. Można je znaleźć wszędzie w Internecie oraz w tak zwanych „analitycznych analizach predykcyjnych”.
Wydaje mi się, że znasz pracę Tufte'a (omawiał także użycie wielu wykresów kołowych ), ale bardziej zabawny jest fakt, że drugi rozdział Gramatyki grafiki Wilkinsona zaczyna się od „Jak zrobić wykres kołowy?”. Prawdopodobnie zdajesz sobie również sprawę, że punktowy wykres Clevelanda , a nawet wykres słupkowy , przekaże znacznie dokładniejsze informacje. Problem wydaje się wynikać ze sposobu, w jaki nasz system wizualny radzi sobie z informacjami przestrzennymi. Jest nawet cytowany w oprogramowaniu R. z pomocy online dla pie
,
Cleveland (1985), strona 264: „Dane, które można przedstawić za pomocą wykresów kołowych, zawsze można przedstawić za pomocą wykresu punktowego. Oznacza to, że zamiast mniej dokładnych ocen kąta można dokonywać ocen pozycji na wspólnej skali ”. To stwierdzenie opiera się na badaniach empirycznych Cleveland i McGilla, a także na psychologach percepcyjnych.
Cleveland, WS (1985) Elementy wykresów danych . Wadsworth: Monterey, Kalifornia, USA.
Istnieją różne wykresy kołowe (np. Wykresy podobne do pączków), z których wszystkie wiążą się z tymi samymi problemami: nie jesteśmy dobrzy w ocenie kąta i obszaru. Nawet te używane w „corrgram”, jak opisano w Friendly, Corrgrams: Wyświetlacze eksploracyjne dla macierzy korelacji , American Statistician (2002) 56: 316, są trudne do odczytania, IMHO.
W pewnym momencie zastanawiałem się jednak, czy nadal mogą być przydatne, na przykład (1) wyświetlanie dwóch klas jest w porządku, ale zwiększenie liczby kategorii ogólnie pogarsza czytanie (szczególnie przy silnym braku równowagi między%), (2) oceny względne są lepsze niż absolutne, czyli wyświetlanie obok siebie dwóch wykresów kołowych, powinno sprzyjać lepszej ocenie wyników niż prosty szacunek, powiedzmy, wykres kołowy mieszający wszystkie wyniki (np. dwustronna tabela krzyżowa klasyfikacji). Nawiasem mówiąc, zadałem podobne pytanie do Hadleya Wickhama, który uprzejmie wskazał mi następujące artykuły:
- Spence, I. (2005). No Humble Pie: Geneza i wykorzystanie wykresu statystycznego . Journal of Educational and Behavioral Statistics , 30 (4), 353–368.
- Heer, J. and Bostock, M. (2010). Crowdsourcing: Percepcja graficzna: wykorzystanie mechanicznego turka do oceny projektu wizualizacji . CHI 2010 , 10–15 kwietnia 2010 r., Atlanta, Georgia, USA.
Podsumowując, uważam, że są one po prostu dobre do rażącego zobrazowania rozkładu od 2 do 3 klas (używam ich od czasu do czasu, aby pokazać rozkład mężczyzn i kobiet w próbie na histogramie wiekowym), ale muszą im towarzyszyć względne częstotliwości lub liczy się to, że są naprawdę pouczające. Tabela nadal byłaby lepsza, ponieważ można dodawać marże i wykraczać poza klasyfikację dwukierunkową.
Wreszcie istnieją alternatywne ekrany oparte na idei wykresu kołowego. Mogę wymyślić kwadratowy wykres kołowy lub waflowy , opisany przez Roberta Kosarę w Zrozumienie wykresów kołowych .