Kontekst:
Przez ten czas zyskałem zestaw heurystyk, jak efektywnie wykreślić powiązanie między dwiema zmiennymi numerycznymi. Wyobrażam sobie, że większość ludzi pracujących z danymi miałaby podobny zestaw reguł.
Przykładami takich reguł mogą być:
- Jeśli jedna ze zmiennych jest dodatnio wypaczona, rozważ wykreślenie tej osi na skali logarytmicznej.
- Jeśli istnieje wiele punktów danych (np. N> 1000), zastosuj inną strategię, na przykład stosując jakąś formę częściowej przezroczystości lub próbkując dane;
- Jeśli jedna ze zmiennych przyjmuje ograniczoną liczbę dyskretnych kategorii, rozważ użycie drgań lub wykresu słonecznika;
- Jeśli istnieją trzy lub więcej zmiennych, rozważ użycie macierzy wykresu rozrzutu;
- Często przydatne jest dopasowanie jakiejś linii trendu;
- Dostosuj rozmiar znaku kreślenia do wielkości próbki (dla większego n użyj mniejszego znaku kreślenia);
- i tak dalej.
Pytanie:
Chciałbym móc skierować uczniów do strony internetowej lub witryny, która wyjaśnia te i inne sztuczki w celu skutecznego kreślenia powiązań między dwiema zmiennymi numerycznymi, być może z przykładami.
- Czy są jakieś strony lub witryny w Internecie, które dobrze sobie z tym radzą?