Dlaczego ciągła wartość jittera na wykresie rozrzutu?


12

Używam Orange Canvas i wygenerowałem wykres rozproszenia. Mam możliwość fluktuacji zmiennych ciągłych, ale tak naprawdę nie wiem, dlaczego miałbym to robić.

Jaki jest pomysł na drżenie?


1
Aby poradzić sobie z nadrukiem, a tym samym dać mniej mylące wrażenie wizualne. Jeśli masz tylko kilka punktów, nie musisz tego robić.
mdewey

Aby zobaczyć konkretny przykład drgań pomagających zobaczyć wzorce w danych, zobacz moją odpowiedź tutaj: Jak wyodrębnić informacje z macierzy rozrzutu, gdy masz duże N, dane dyskretne i wiele zmiennych?
gung - Przywróć Monikę

Odpowiedzi:


18

Ten post dobrze to wyjaśnia.

Często, gdy masz wiele nakładających się punktów, może być trudno zrozumieć ich gęstość. Dwa tysiące punktów w (1, 1) wydają się takie same jak jeden punkt w (1, 1). Dodanie jittera zamienia nakładające się punkty w rozmaz i sprawia, że ​​gęstość punktów jest oczywista.


Czy nie chodzi o dyskretne dane, podczas gdy pytanie wyraźnie dotyczy ciągłych danych?
ameba mówi Przywróć Monikę

Dodając do tego, co powiedział @amoeba, ta odpowiedź jest poprawna, gdy dodajesz, że ciągłe dane, którymi się zajmujemy, są zaokrąglane ze względu na precyzję pomiaru, a więc występują problemy opisane powyżej.
Tim
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.