Jakie są podstawowe zasady projektowania i produkcji działek?

19

Tło:

Wcześniej w Cross Validated mieliśmy pytania dotyczące:

@David zasugerował w komentarzach do tego pytania , że powinniśmy mieć pytanie społeczności wiki z jedną regułą wizualizacji na odpowiedź , na którą społeczność mogłaby głosować.

Pytanie

Jakie są podstawowe zasady projektowania i tworzenia graficznych reprezentacji danych?

Zasady

Jedna zasada na odpowiedź
Najlepiej dołącz krótkie wyjaśnienie, dlaczego uważasz, że to dobry pomysł
Preferowane są odpowiedzi z przykładami (kod i obraz) dobrych i złych praktyk.

data-visualization

— Jeromy Anglim
źródło

13

Substancja nad formą : wybierz odpowiedni wykres, styl, kolorystykę lub inne parametry graficzne, aby pokazać to, co chcesz pokazać, a nie to, na co koniecznie pozwala twój pakiet wykresów.

— Fomite
źródło

8

(+1) Często wolę najpierw naszkicować wykres na papierze, aby zmniejszyć prawdopodobieństwo, że moje decyzje projektowe będą kierowane ścieżką najmniejszego oporu stworzoną przez oprogramowanie do tworzenia wykresów.

— Jeromy Anglim

13

Pomocna może być znajomość trzech wymiarów koloru. Jeśli używasz kilku kolorów, powinny one idealnie różnić się pod względem kilku z tych wymiarów, a nie tylko jednego.

Wartość. Wykres powinien pozostać czytelny nawet w czerni i bieli. Ta prosta zasada powinna uwzględniać ślepotę kolorów, drukarki niskiej jakości i złe warunki oświetleniowe. Nawet jeśli używasz różnych odcieni, upewnij się, że wartości są wystarczająco różne. W szczególności wykresy powinny być ciemne na jasnym tle (lub na odwrót), ale nie szare na szarym tle. Najgorszym przykładem byłby niebieski wykres na czerwonym tle - oba są wartościami średnimi, tj. Dałyby bardzo podobne szarości po konwersji na czarno-biały.

Nasycenie. Nasycenie należy stosować z umiarem: czysta czerwona linia może być w porządku, ale grubsza, mniej nasycona czerwona linia będzie bardziej czytelna (zwiększona grubość pomaga odróżnić kolory i pozwala zmniejszyć nasycenie). Z drugiej strony bolesny jest czysty czerwony obszar: nie używaj nasyconych kolorów do wypełnienia obszarów. Do palety kolorów Brewer (przeznaczony dla map, a nie linia działki) podać przykłady wyborów kolorystycznych niskim nasyceniu. Najgorszym przykładem byłoby ponownie nasycone tło (niebieski na czerwonym lub czerwony na niebieskim).

Odcień. Jak wspomniano w @gung, unikaj kombinacji czerwony / zielony (sygnalizacja świetlna): jest znacznie więcej osób niewidomych niż myślisz. Zwłaszcza z odcieniem, mniej znaczy więcej. Na przykład, aby wykreślić wartości „rozbieżne” (tj. Wielkości, które mogą być dodatnie lub ujemne), użyj tylko dwóch odcieni (dla wartości dodatnich i ujemnych), aby czytelnik mógł natychmiast rozpoznać, co jest wysokie, a co niskie. Zastosowanie dyskretnego gradientu może dać znacznie czytelniejszy wykres: granice między kolorami stają się widoczne i tworzą wykres konturowy.

Możesz przeczytać praktyczne zasady S. Few dotyczące używania kolorów w tabelach lub zapoznać się z dowolnym materiałem na temat „teorii kolorów” dla studentów sztuki lub projektowania.

— Vincent Zoonekynd
źródło

+1, fajna informacja tutaj. Twój punkt widzenia na temat wartości i sposobu renderowania kolorów po konwersji na czarno-biały jest szczególnie dobry. Pomocny jest również link do kilku artykułów. Jedna uwaga: najlepiej nie odnosić się do innych odpowiedzi jako „powyżej”, zamiast tego należy użyć @ so-and-so; odpowiedzi zmieniają się w zależności od liczby głosów.

— gung - Przywróć Monikę

11

Umieść jak najwięcej wymaganych informacji w samej figurze. Nie wymagaj od czytelnika odwoływania się do podpisu, np. W celu identyfikacji znaczenia różnych symboli lub kolorów. Umieść dowolne informacje (lub informacje uzupełniające), które nie mogą wejść na samą postać w podpisie. Chodzi o to, aby zminimalizować wysiłek wymagany przez przeglądarkę grafów w celu wyodrębnienia odpowiednich informacji - najlepiej: wykres jest zrozumiały, następny najlepszy: wymagane dodatkowe informacje można szybko uzyskać z podpisu, co najgorsze: widz musi uważnie przeczytać całą sekcję wyników szukającą kluczowych szczegółów, aby dowiedzieć się, co się dzieje.

— David
źródło

1

+1, a my możemy rozszerzyć ten pomysł: chcemy, aby ludzie widzieli wykres i wiedzieli (o ile to możliwe), co się dzieje bez konieczności czytania podpisu, a także kiedy potrzebują dodatkowych informacji, aby mieć to w podpisie, aby ludzie mogli przeczytać podpis i wiedzieć, czego potrzebują, bez konieczności czytania gazety w poszukiwaniu tego jednego kluczowego szczegółu.

— gung - Przywróć Monikę

1

@ Gung, ponieważ jest to CW, prosimy o edycję odpowiedzi w celu odzwierciedlenia komentarzy.

— David LeBauer,

10

Spraw, aby fabuła była jak najprostsza. Słowem Tufte „zminimalizuj stosunek atramentu do danych”.

Na przykład unikaj:

więcej kolorów lub kształtów niż jest to wymagane
więcej znaczników niż to konieczne
Efekty 3D na wykresie 2-D.
za pomocą legendy, gdy obiekty można bezpośrednio opisać

— David LeBauer
źródło

Nie zgadzam się z Tufte tutaj. Po pierwsze, duża część motywacji tej zasady w jego oryginalnej książce polega na tym, ile czasu trzeba poświęcić na rysowanie dodatkowych, niepotrzebnych linii; ale dzisiaj nie ma to znaczenia. Po drugie, prawdziwy pomysł jest lepiej uchwycony przez zasadę Clevelanda, aby zmaksymalizować informatywność grafiki, ponieważ czasami fabuła może stać się bardziej pouczająca dzięki większej ilości atramentu, ale obie zasady zakazują Trojana.

— gung - Przywróć Monikę

@gung, gdzie wysiłek / czas zostały przedstawione jako motywacja przez Tufte. Nie przypominam sobie tej części (ale nie mam też tekstu pod ręką).

— David LeBauer,

1

Ja też tego nie mam, ale w jego pierwszej książce Visual Display pamiętam, jak mówił, ile razy musiałeś odkładać linijkę, żeby narysować wykres. Może „duże” było przesadą, ale pamiętam, że to czytałem i myślałem: „kogo teraz to obchodzi?”. W Elements Cleveland przedstawia przekonujący argument, że reguła Tufte jest błędna. Twierdzi, że chodzi o maksymalizację transferu informacji i pokazuje, że zasada ta eliminuje również to, czego Tufte nie lubi, ale dopuszcza przypadki (które pokazuje), w których dodatkowy atrament niepochodzący z danych pomaga uczynić wykres bardziej pouczającym.

— gung - Przywróć Monikę

Powinienem wyjaśnić, że nie zgadzam się z niektórymi konkretnymi sugestiami (np. Brak 3D, brak chartjunk); Kłócę się z regułą Tufte'a jako wytyczną dla grafiki.

— gung - Przywróć Monikę

@gung Zinterpretowałem tę samą dyskusję jako narzędzie heurystyczne - łatwy sposób dla czytelnika na zrozumienie tego podejścia, a nie sposób na ograniczenie pracy projektanta.

— David LeBauer

9

Zostaw czas na edycję. Stworzenie dobrego wykresu wymaga czasu i często (przynajmniej dla mnie) wielu prób.

— Peter Flom - Przywróć Monikę
źródło

6

Nie sprzeciwiaj się czerwieni i zieleni. Kolor może być pomocny, ale przy korzystaniu z koloru należy zawsze pamiętać, że znaczna mniejszość ludzi jest ślepa na czerwono-zielone kolory. Kiedyś pokazywałem komuś jakieś dane, a on nie mógł zrozumieć, co się dzieje na moich wykresach - to była strata i czułem się dość głupio. Inne formy ślepoty na kolory są bardzo rzadkie, ale czerwono-zielone są dość powszechne. Ta strona ma wiele dobrych informacji. Oto kilka porad:

Jeśli potrzebujesz tylko dwóch kolorów, użyj niebieskiego i żółtego - nie używaj czerwonego i zielonego.
Jeśli potrzebujesz gradientu, zmień kolor z niebieskiego na żółty, zmieniając jednocześnie nasycenie i jasność - nie używaj tęczy.
Jeśli potrzebujesz zakodować więcej niż dwa elementy (np. Punkty na wykresie rozrzutu z więcej niż dwóch grup lub kilku linii), odwróć swoje kolory, używając również różnych symboli / stylów wydruku. Na przykład różne symbole kreślenia: o + <sw lub linie: ciągłe, kropkowane, przerywane, przerywane kropkami itp. (Możesz także dodawać symbole kreślenia do linii lub zmieniać grubość linii).

— Gung
źródło

Rzeczywiście zastanawiałem się raczej często: jaki jest najlepszy gradient kolorów do zastosowania?

— steffen

4

Nie używaj skumulowanych wykresów słupkowych. I w powiązanej notatce, jeśli masz element w skali Likerta, nie odczuwaj potrzeby pokazywania proporcji dla każdej odpowiedzi na każdy element. Te wykresy powodują, że moje oczy krwawią.

Nie używaj wykresów kołowych.

Nie powielaj danych zawartych na wykresie, wrzucając do tabeli.

Użyj czcionek bezszeryfowych, takich jak Arial, do tytułów wykresów itp., Ponieważ te typy czcionek zostały zaprojektowane w taki sposób.

Żaden post na temat projektu nie jest kompletny bez odniesienia do książki, naprawdę podoba mi się statystyczna zasada praktyczna . Rozdział 9 jest nieco istotny dla dyskusji tutaj i fragmentów, na które wskazuję, gdy zapytany, dlaczego nienawidzę skumulowanych wykresów słupkowych i kołowych. :)

Spowiedź: w jednej z moich pierwszych ról konsultacyjnych dla małego klienta organizacji pozarządowej dałem im raport zawierający wiele ułożonych wykresów słupkowych, wydrukowanych w kolorze (było to w połowie lat 90.). Myślę, że udało mi się uzyskać żółte, fioletowe i czerwone u tych szczeniąt.

— Michelle
źródło

3

Nie zadzieraj z osiami. Nie odcinaj pierwszych stu jednostek tylko dlatego, że nachylenie wykresu wygląda bardziej imponująco. Obraz zostanie naklejony, a ludzie zapamiętają znacznie większy efekt niż faktycznie zmierzono.

— xmjx
źródło

2

Odcięcie danych w celu zmiany pozornego nachylenia jest nieuczciwe. OTOH, istnieje prawdziwe pytanie, czy osie powinny zawsze zawierać 0 i (nieco mniej powiązane) zastosowane proporcje. Cleveland ma mocny argument, że wykresy są bardziej pouczające, jeśli zmaksymalizujesz dane w oknie danych, a „przechylisz” nachylenie do 45 stopni. Poznaj swoich odbiorców tutaj: Cleveland twierdzi, że profesjonalną publiczność należy traktować jako kompetentną i kompetentną, ale z naiwną publicznością albo wyraźnie wskaż te cechy i wyjaśnij je, albo (prawdopodobnie) nie używaj ich.

— gung - Przywróć Monikę

Nawet profesjonalni odbiorcy (przypuszczam) miesiące później zapamiętają tylko stromą linię na wykresie i zapomną przechwycenie i wszystko inne. Możesz mieć wszystkie te dane na (płaskim) wykresie, poprawnie oznaczając wartości ekstremalne, i nadal mieć w sobie informację, że nic tak naprawdę nie zmieniło czasu.

— xmjx

2

Nie zgadzam się. Nie sądzę, aby rozsądną zasadą było naleganie, aby wszystkie osie zaczynały od zera, jeśli to jest sugerowane. Grafika powinna pokazywać zmienność i strukturę danych - jeśli ważne jest fluktuacja 100 000 wokół wartości dwóch milionów (i być może różnice między dwiema grupami), grafika powinna pokazywać, że „dwa miliony to duża liczba „.

— Peter Ellis,

Podobnie jak w przypadku każdej reguły projektowej, myślę, że można ją złamać, jeśli naprawdę zrozumiesz praktyczne znaczenie przedstawionej odmiany i sposób jej interpretacji przez odbiorców. Ale ta zasada jest łamana tak często i tak rażąco, że myślę, że głośno jest głośno ogłaszać „Wszystkie działki muszą zawierać zero! *” Wyszukiwarka amerykańskich działek dotyczących własności domów ilustruje ten punkt ładnie - prawie na każdej działce wygląda to jak fluktuacja właściciela gwałtownie w ciągu ostatnich dwóch dekad, kiedy tak naprawdę maksymalny spread wynosi około 5%.

— Matt Parker,

Nie to, że 5% jest nieistotne - i większość z tych fabuł wiąże się z argumentami na temat konsekwencji polityk, które wygenerowały tę fluktuację. Sądzę jednak, że argumenty te byłyby jeszcze silniejsze, gdyby podkreślały, że masywne polityki o ogromnych konsekwencjach ekonomicznych faktycznie miały stosunkowo niewielki wpływ na właścicieli domów.

— Matt Parker