Jak nazywa się ten wykres wykorzystujący pionowe linie do pokazania rozkładu?


14

Czy istnieje oficjalna nazwa tego niezwykle prostego wykresu, w którym pionowe linie wskazują rozkład niektórych próbek w zakresie?

wprowadź opis zdjęcia tutaj


8
„dywanik”, gdy jest używany z innymi działkami.
Gimelist,

7
Nie ma oficjalnej nazwy. Wiele zależy od tego, czy użycie linii pionowych jest niezbędne, czy inne symbole byłyby akceptowane, a także od tego, czy dozwolone jest układanie w stosy lub drżenie, gdy istnieją powiązania. Na stats.stackexchange.com/questions/102735/ ... Podaję 22 różne nazwy znalezione dla szerszego sensu tego rodzaju fabuły.
Nick Cox,

Odpowiedzi:


24

Pierwszym przykładem, w którym je widziałem, są paski przedstawiające rozkłady empiryczne: I. teksturowane paski punktowe (Tukey i Tukey, 1990), chociaż nigdy nie byłem w stanie uzyskać tego raportu technicznego.

Tim ma rację: często towarzyszą im jako dywanik na dodatkowej działce, aby pokazać lokalizację poszczególnych obserwacji, ale działka dywanowa jest nieco bardziej ogólna i ten rodzaj wątku nie zawsze znajduje się na dywaniku innej działki, jak pokazuje twoje pytanie!

  • Oto przykład użycia punktów na dywanie zamiast linii.
  • Oto przykład dywanu będącego punktami i nie wyświetlającymi wszystkich danych, ale tylko dane brakujące w innym wymiarze wykresu rozrzutu.

Tak więc wykres dywanu nie zawsze jest zbiorem linii na granicach innego wykresu, a ten typ wykresu w twoim pytaniu nie zawsze znajduje się na marginesie innego wykresu. Oto przykład linii nałożonych na gęstość jądra zamiast na dywanik wykresu, zwany wykresem fasoli . Wydaje mi się, że większe linie służą do wizualizacji różnych kwantyli (czyli wartości literowych) rozkładu.


(źródło: biomedcentral.com )

W gramatyce graficznej Wilkinsona można go uznać za jednowymiarowy wykres rozproszenia, ale z wykorzystaniem segmentów linii zamiast typowych domyślnych okręgów. Chodzi o to, aby zapobiec nałożeniu wielu pobliskich punktów. Jeśli masz wiele punktów i narysujesz je półprzezroczysto, ostatecznie zamieniają się w pasek gęstości, zobacz ostateczne zdjęcie w tym poście .

Widziałem nawet, jak sugerowano, aby używać ich jako wykresów przebiegu w czasie ( Greenhill i in., 2011 ) w tym przykładzie do wizualizacji danych binarnych. Greenhill nazywa je na przykładowych wykresach separacji , a oto przykład zaczerpnięty z przywołanego dokumentu (str. 995):

wprowadź opis zdjęcia tutaj

Tak więc w tym przykładzie istnieją wartości wzdłuż całej osi, a kolor służy do wizualizacji zmiennej binarnej. Czarna linia na tym wykresie to skumulowany odsetek czerwonych obserwacji.


6
Fabuła +1 Strip jest również częstym terminem.
whuber

1
@whuber: Strip strip, yes lub strip strip .
ameba mówi Przywróć Monikę

Ściśle mówiąc, wykres separacji jest zupełnie inny. Jest to skumulowany wykres słupkowy z przedziałem jednostkowym podzielonym na słupki o długości dla punktów danych. Słupki są ułożone w stos w kolejności przewidywanego prawdopodobieństwa odpowiedzi z modelu i pokolorowane na jeden z dwóch kolorów w zależności od zaobserwowanej wartości binarnej. Dla umiarkowanego wygląda to na wykres słupkowy, ale to nie jest jeden. Chodzi o wykres paskowy (lub jakkolwiek to się nazywa), że symbole punktowe (które mogą być cienkimi liniami) są umieszczane tam, gdzie należą, a nie to, że dzielimy linię na wzajemnie wykluczające się segmenty. n n1/nnn
Nick Cox,

To jest uczciwy opis @NickCox, ale nie sądzę, aby wykresy separacji były tak różne. W gramatyce Wilkinsona można go uznać za jednowymiarowy wykres rozproszenia, z rangą na pojedynczym wymiarze, a następnie za pomocą koloru, aby rozróżnić dwa typy punktów. Mając tylko dwa rodzaje punktów, nie potrzebujesz nawet danych dla jednego z zestawów, więc oryginalny wykres OP może być wykresem separacji z czarnymi pasami wyświetlającymi jedną kategorię, a tło szare uzupełnienie.
Andy W

Nie różni się tak bardzo od niektórych wykresów przebiegu w czasie, w których widziałem wizualizacje zwycięstw / porażek drużyn sportowych. (Wszystkie wykresy muszą być odwzorowane na skończony interwał, aby rzutować dane na stronę / ekran komputera, więc czy rzeczywiste dane są ograniczone do interwału jednostkowego, nie uważam za istotne w opisie samego wykresu.) Nie zadzwoniłbym wykres rozrzutu uporządkowanych danych pod inną nazwą, ponieważ punkty nie są umieszczane „tam, gdzie należą”.
Andy W

20

Nazywa się to fabułą dywanów (patrz np. Tutaj lub tutaj ). W R można to zrobić za pomocą rugfunkcji.

Wykres wydaje się pojawiać również pod inną nazwą, jako wykres słupkowy , tak nazywa go Phillip I. Dobry we wprowadzeniu do statystyki poprzez Resampling Methods i R / S-Plus (2005, Wiley). W R jest wywoływany przez stripchartfunkcję.

Wydaje się, że niewielka wersja, która często towarzyszy większej działce, nazywa się wykresem dywanowym, natomiast samodzielny wykres złożony z punktów lub linii pionowych nosi nazwę wykresu paskowego.


Cholera, byłem tak blisko - szukałem szmaty (i przewidywalnie nic nie wymyśliłem). Dziękuję Ci!
styczeń

2
Myślę, że w praktyce ludzie odnoszą się do takich wykresów jako wykresów dywanowych tylko wtedy, gdy są marginalne do jakiegoś innego punktu, takiego jak histogram lub wykres rozproszenia.
Nick Cox,

3

W handlowym znakowaniu towarów, kodem kreskowym lub

jeśli są to linie częstotliwości wykreślone w czasie, Spectrum .

EDYCJA 1

Kiedy w chmurach elektromagnetycznych lub chromatografach gazowych siły są wykreślane liniowo na skali częstotliwości, możemy również powiedzieć spektrum.


3
Cześć, witam na stronie. Niestety nie odpowiada to na pytanie, ponieważ linie w kodach kreskowych lub widmach nie „wskazują rozkładu niektórych próbek w zakresie”, jak określono w pytaniu.
Juho Kokkala,

4
@JuhoKokkala Nie zgadzam się częściowo. Kody kreskowe stosowane w przemyśle nie są zgodne, uzgodnione, ale termin „wykres kodów kreskowych” został użyty do wskazania tego rodzaju wykresu dla rzeczywistych danych. Podobnie dane spektroskopowe z pewnością również kwalifikują się jako dane. Nie trzymałbym się słów OP, ponieważ dezorientują one „próbki” i „próbki wartości”.
Nick Cox,

2
Zgadzam się, że dywanik jest najbliższy. Ale nazywa się to również działką z kodem kreskowym. Jednak wykres kodu kreskowego często ma grubość linii lub odcień / przezroczystość, aby pokazać gęstość blisko położonych wartości. Używamy tego rodzaju wykresów z danymi DNA do oznaczania lokalizacji obiektów.
Dianne Cook

0

Mam ten sam problem: jak nazywa się „kod kreskowy”, podobnie jak wizualizacja dla danych typu prawda / fałsz

Moim celem jest przedstawienie listy prawdziwych / fałszywych tablic odpowiadających tablicy słów w ustalonym miejscu w tablicy. Podobnie jak reprezentacja „widma światła” w celu zidentyfikowania powiązania konkretnej fali świetlnej .... w tej samej sytuacji chcę wyrazić brakujące słowa i słowa obecne

Znalazłem na Vega the Strip Plot

https://vega.github.io/vega-lite/examples/tick_strip.html

Myślę, że moim celem jest lepsza nazwa reprezentująca mój pomysł na wizualizację

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.