Czasami możemy „poszerzyć wiedzę” za pomocą nietypowego lub innego podejścia. Chciałbym, aby ta odpowiedź była dostępna dla przedszkolaków, a także dobrze się bawić, aby wszyscy wyciągnęli kredki!
Biorąc pod uwagę sparowane dane , narysuj ich wykres rozrzutu. (Młodsi uczniowie mogą potrzebować nauczyciela, aby to dla nich stworzył. :-) Każda para punktów , na tym wykresie określa prostokąt: jest to najmniejszy prostokąt, którego boki są równoległe do osie zawierające te punkty. Punkty znajdują się zatem w prawym górnym i lewym dolnym rogu (relacja „dodatnia”) lub w lewym górnym i prawym dolnym rogu (relacja „ujemna”).(x,y)(xi,yi)(xj,yj)
Narysuj wszystkie możliwe takie prostokąty. Pokoloruj je przezroczyście, dzięki czemu dodatnie prostokąty będą czerwone (powiedzmy), a ujemne prostokąty „anty-czerwone” (niebieskie). W ten sposób wszędzie tam, gdzie prostokąty się nakładają, ich kolory są albo poprawiane, gdy są takie same (niebieski i niebieski lub czerwony i czerwony), lub anulowane, gdy są różne.
( Na tej ilustracji dodatniego (czerwonego) i ujemnego (niebieskiego) prostokąta nakładka powinna być biała; niestety to oprogramowanie nie ma prawdziwego koloru „czerwonego”. Nakładka jest szara, więc przyciemni fabuła, ale ogólnie ilość netto czerwieni jest poprawna ).
Teraz jesteśmy gotowi na wyjaśnienie kowariancji.
Kowariancja jest ilością netto czerwieni na wykresie (traktując niebieski jako wartości ujemne).
Oto kilka przykładów z 32 punktami dwumianowymi wyciągniętymi z rozkładów o podanych kowariancjach, uporządkowanych od najbardziej negatywnych (najciemniejszych) do najbardziej pozytywnych (najbardziej czerwonych).
Rysowane są na wspólnych osiach, aby były porównywalne. Prostokąty są lekko obrysowane, aby pomóc Ci je zobaczyć. To jest zaktualizowana wersja oryginału (2019): używa oprogramowania, które prawidłowo kasuje kolory czerwony i cyjan w nakładających się prostokątach.
Wydedukujmy pewne właściwości kowariancji. Zrozumienie tych właściwości będzie dostępne dla każdego, kto faktycznie narysował kilka prostokątów. :-)
Dwuliniowość. Ponieważ ilość czerwieni zależy od wielkości wykresu, kowariancja jest wprost proporcjonalna do skali na osi x i do skali na osi y.
Korelacja. Kowariancja rośnie, gdy punkty zbliżają się do linii opadającej w górę i maleje, gdy punkty zbliżają się do linii opadającej w dół. Wynika to z faktu, że w pierwszym przypadku większość prostokątów jest dodatnia, aw drugim przypadku większość jest ujemna.
Związek z powiązaniami liniowymi. Ponieważ powiązania nieliniowe mogą tworzyć mieszanki dodatnich i ujemnych prostokątów, prowadzą one do nieprzewidywalnych (i niezbyt przydatnych) kowariancji. Powiązania liniowe można w pełni interpretować za pomocą dwóch poprzednich charakterystyk.
Wrażliwość na wartości odstające. Geometryczna wartość odstająca (jeden punkt oddalony od masy) stworzy wiele dużych prostokątów w połączeniu ze wszystkimi innymi punktami. Już samo to może stworzyć dodatnią lub ujemną ilość czerwieni na całym obrazie.
Nawiasem mówiąc, ta definicja kowariancji różni się od zwykłej jedynie uniwersalną stałą proporcjonalności (niezależną od wielkości zestawu danych). Skłonni matematycznie nie będą mieli problemów z wykonaniem algebraicznego pokazu, że podana tu formuła jest zawsze dwa razy większa niż zwykła kowariancja.