Czy istnieje graficzna reprezentacja kompromisu wariancji odchylenia w regresji liniowej?


18

Cierpię na zaciemnienie. Pokazano mi następujący obraz, aby pokazać kompromis wariancji odchylenia w kontekście regresji liniowej:

Model wielomianowy dla danych, przypadek prosty i złożony

Widzę, że żaden z dwóch modeli nie jest dobrze dopasowany - „prosty” nie docenia złożoności relacji XY, a „złożony” jest po prostu zbyt duży, zasadniczo ucząc się danych treningowych na pamięć. Jednak całkowicie nie dostrzegam stronniczości i wariancji na tych dwóch zdjęciach. Czy ktoś mógłby mi to pokazać?

PS: Odpowiedź na intuicyjne wyjaśnienie kompromisu wariancji uprzedzeń? tak naprawdę mi nie pomogło, byłbym zadowolony, gdyby ktoś mógł zapewnić inne podejście w oparciu o powyższe zdjęcie.

Odpowiedzi:


11

Kompromis wariancji odchylenia opiera się na rozbiciu średniego błędu kwadratowego:

M.S.mi(y^)=mi[y-y^]2)=mi[y-mi[y^]]2)+mi[y^-mi[y^]]2)

Jednym ze sposobów sprawdzenia handlu wariancji odchylenia jest to, jakie właściwości zestawu danych są używane w dopasowaniu modelu. W przypadku prostego modelu, jeśli założymy, że do dopasowania linii prostej zastosowano regresję OLS, wówczas do dopasowania linii zostaną użyte tylko 4 liczby:

  1. Przykładowa kowariancja między xiy
  2. Próbka wariancji x
  3. Średnia próbki x
  4. Średnia próbki y

Tak więc każdy wykres, który prowadzi do tych samych 4 liczb powyżej, prowadzi do dokładnie tej samej dopasowanej linii (10 punktów, 100 punktów, 100000000 punktów). W pewnym sensie jest to niewrażliwe na konkretną obserwowaną próbkę. Oznacza to, że będzie „stronniczy”, ponieważ skutecznie ignoruje część danych. Jeśli ta zignorowana część danych okazała się ważna, prognozy będą konsekwentnie błędne. Zobaczysz to, jeśli porównasz dopasowaną linię przy użyciu wszystkich danych z dopasowanymi liniami uzyskanymi z usunięcia jednego punktu danych. Będą raczej stabilne.

Teraz drugi model wykorzystuje każdy skrawek danych, jaki może uzyskać, i dopasowuje dane tak blisko, jak to możliwe. Dlatego ważna jest dokładna pozycja każdego punktu danych, dlatego nie można przesuwać danych treningowych bez zmiany dopasowanego modelu, tak jak w przypadku OLS. Dlatego model jest bardzo wrażliwy na konkretny zestaw treningowy, który posiadasz. Dopasowany model będzie bardzo różny, jeśli wykonasz ten sam wykres kropli danych.


Odchylenie oraz odchylenia modelu Oszacowanie parametru θ lub przewidywaną wartość wyjściowa y ? Niektórzy ludzie mówią mi, że terminów stronniczości i wariancji można używać tylko do opisania parametru modelu θ , a nie danych x , y , prawda? θ^y^θx,y
awokado

y^θ^

θ^bias(θ^)=θE[θ^]θf(x)=a+bx+cx2h(x)=d+ex(a,b,c)(d,e)bias(d)bias(e)

@loganecolss - nie jest to paradoks, ponieważ pojęcie uprzedzeń istnieje tylko „lokalnie” - to znaczy w odniesieniu do danego modelu statystycznego. „Paradoks” istnieje dla osoby, która: 1) zna „prawdziwy model” i 2) decyduje się go nie używać. Ta osoba jest idiotką w mojej książce. Jeśli nie znasz „prawdziwego modelu”, to nie ma problemu - chyba że znalazłeś dobry model i nie zdecydowałeś się go użyć ...
probabilityislogic

1
fa(x,z1,z2),,zK.)zjaK.
probabilityislogic

5

Podsumowując to, co myślę, że wiem w sposób niematematyczny:

  • stronniczość - twoje przewidywania będą niepoprawne, gdy użyjesz prostego modelu, i stanie się to w każdym zestawie danych, w którym używasz modelu. Twoje przewidywania będą błędne
  • wariancja - jeśli użyjesz modelu złożonego, otrzymasz bardzo różne prognozy na podstawie dowolnego zestawu danych, którego używasz

Ta strona ma całkiem dobre objaśnienie ze schematami podobnymi do tego, co opublikowałeś. (Pominąłem jednak górną część, po prostu przeczytałem część ze schematami) http://www.aiaccess.net/English/Glossaries/GlosMod/e_gm_bias_variance.htm (najechanie myszą pokazuje inną próbkę, na wypadek gdybyś tego nie zauważył!)


To interesująca strona i dobre ilustracje, ale uważam je za bardziej mylące niż pomocne, ponieważ (a) „stronniczość” i „wariancja” omawiane w kontekście regresji nie wydają się być stronniczością i wariancją zdefiniowanymi na początku tego strona i (b) wcale nie jest jasne, czy złożone stwierdzenia (o tym, jak zmienność i wariancja zmieniają się w zależności od liczby parametrów) są prawidłowe.
whuber
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.