Zastanawiasz się, co oznacza ta tabela analizy wykresu fasoli


11

Jak interpretować i generować wykresy wykresów fasoli. Oto jeden przykład wzięty z Walkesa i in. 2010 r . Jakiego rodzaju dane są najbardziej przydatne?

fabuła fasoli
(źródło: biomedcentral.com )


3
„Wykres bean jest alternatywą dla wykresu box do wizualnego porównania danych jednowymiarowych między grupami. W wykresie bean poszczególne obserwacje są pokazane jako małe linie na jednowymiarowym wykresie rozrzutu. Ponadto widoczna jest szacunkowa gęstość rozkładów i wyświetlana jest średnia ”. Wyciąg pobrany stąd .

Dla tych, którzy nie wiedzą: jest to bliski krewny fabuły skrzypiec (vioplot).

Odpowiedzi:


12

Wykresy pudełkowe zostały naprawdę zaprojektowane dla normalnych danych, a przynajmniej danych niemodalnych. Beanplot pokazuje rzeczywistą krzywą gęstości, która jest bardziej pouczająca.

Kształt jest gęstością, a krótkie poziome linie reprezentują każdy punkt danych. Łączy to wszystko, co najlepsze z wykresu pudełkowego, wykresu gęstości i wykresu dywanu w jednym i jest bardzo czytelny.

Niestety, w przykładzie, który wybrałeś, postanowiłeś dodać kilka dłuższych linii, które zaśmiecają wykres nie do poznania (dla mnie). [fantastyczna okazja]

EDYCJA: Po dłuższej pracy z wykresem fasoli dłuższe grube linie są średnią (lub opcjonalnie medianą) dla każdej fasoli. Dłuższe cienkie linie to dane, z rodzajem „układania” w stos, w którym szersze linie wskazują bardziej powielone wartości. (Możesz również je drżeć, co wolę, ale przynajmniej „normalna” kategoria ma już dość gęstą liczbę punktów, które drżenie mogą pogorszyć).

Nadal uważam, że wybrany przez ciebie przykład jest raczej zagracony, co można by wyjaśnić, stosując jitter zamiast układania w stosy.

Papier, który opisuje pakiet R do tworzenia wykresów fasoli jest ładny odczytu.


3
+1 - teraz czytam artykuł na temat fasoli. Sugerowałbym również dokument roboczy Hadleya Wickhama, 40 lat fabuły . Przechodzi przez opis różnych działek z mniej więcej tymi samymi celami, co działki fasoli.
Andy W

1

Bez przeczytania całego artykułu wydaje się, że jest to w zasadzie wariant wykresu pudełkowego. Jako taki, możesz go użyć tam, gdzie w innym przypadku użyłbyś wykresu pudełkowego, na przykład porównując rozkłady jednowymiarowe kilku grup. Wyświetla linię dla każdego punktu i nakłada oszacowanie gęstości jądra. Patrząc na to, sądzę, że może to być bardziej pouczające przy małych ilościach danych, ale byłoby zbyt zagracone większą ilością danych. Na pierwszy rzut oka nie wydaje mi się to wstrząsające ziemią. Jeśli chcesz dowiedzieć się czegoś więcej, opracuj swoje pytanie.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.