Czytam książki o regresji liniowej. Istnieje kilka zdań na temat norm L1 i L2. Znam je, po prostu nie rozumiem, dlaczego norma L1 dla rzadkich modeli. Czy ktoś może użyć prostego wyjaśnienia?
Rozumiem, że stacjonarne szeregi czasowe to takie, których średnia i wariancja jest stała w czasie. Czy ktoś może wyjaśnić, dlaczego musimy upewnić się, że nasz zestaw danych jest stacjonarny, zanim będziemy mogli uruchamiać na nim różne modele ARIMA lub ARM? Czy dotyczy to również modeli regresji normalnej, w których autokorelacja …
ANOVA jest równoważna regresji liniowej z użyciem odpowiednich zmiennych fikcyjnych. Wnioski pozostają takie same, niezależnie od tego, czy używasz ANOVA czy regresji liniowej. Czy w świetle ich równoważności istnieje jakikolwiek powód, dla którego stosuje się ANOVA zamiast regresji liniowej? Uwaga: Jestem szczególnie zainteresowany słyszeniem o technicznych przyczynach zastosowania ANOVA zamiast …
W ostatnim kolokwium streszczenie mówcy twierdziło, że korzysta z uczenia maszynowego. Podczas rozmowy jedyną rzeczą związaną z uczeniem maszynowym było to, że wykonują regresję liniową na swoich danych. Po obliczeniu współczynników najlepszego dopasowania w przestrzeni parametrów 5D, porównali te współczynniki w jednym systemie z współczynnikami najlepszego dopasowania w innych systemach. …
Ogólnie, co należy rozumieć przez powiedzenie, że część wariancji w analizie takiej jak PCA jest wyjaśniona przez pierwszy główny składnik? Czy ktoś może to wyjaśnić intuicyjnie, ale również podać dokładną matematyczną definicję tego, co oznacza „wyjaśniona wariancja” w kategoriach analizy głównego składnika (PCA)?xxx Dla prostej regresji liniowej r-kwadrat linii najlepszego …
Miałem pytanie dotyczące interpretacji wykresów generowanych przez wykres (lm) w R. Zastanawiałem się, czy moglibyście mi powiedzieć, jak interpretować wykresy położenia skali i wykresy rezydualne dźwigni? Wszelkie uwagi będą mile widziane. Zakłada podstawową wiedzę na temat statystyki, regresji i ekonometrii.
Wiki omawia problemy, które powstają, gdy wielokoliniowość jest problemem regresji liniowej. Podstawowym problemem jest to, że wielokoliniowość powoduje niestabilne oszacowanie parametrów, co bardzo utrudnia ocenę wpływu zmiennych niezależnych na zmienne zależne. Rozumiem techniczne przyczyny problemów (może nie być w stanie odwrócić , źle warunkowane itp.), Ale szukam bardziej intuicyjnego (być …
Czy kiedykolwiek jest uzasadnione włączenie dwukierunkowej interakcji do modelu bez uwzględnienia głównych efektów? Co jeśli twoja hipoteza dotyczy tylko interakcji, czy nadal musisz uwzględnić główne efekty?
W jakich okolicznościach należy rozważyć zastosowanie metod regularyzacji (regresja kalenicy, lasso lub najmniejszych kątów) zamiast OLS? W przypadku gdy pomaga to w prowadzeniu dyskusji, moim głównym zainteresowaniem jest poprawienie dokładności predykcyjnej.
Spójrz na ten wykres Excela: Linia najlepszego dopasowania „zdrowego rozsądku” byłaby prawie pionową linią przechodzącą przez środek punktów (edytowaną ręcznie na czerwono). Jednak liniowa linia trendu ustalona przez Excel jest pokazaną ukośną czarną linią. Dlaczego Excel stworzył coś, co (dla ludzkiego oka) wydaje się błędne? Jak mogę stworzyć linię najlepszego …
Dość często spotykam się z terminem „rozwiązanie w formie zamkniętej”. Co oznacza rozwiązanie w formie zamkniętej? W jaki sposób można ustalić, czy istnieje rozwiązanie bliskie dla danego problemu? Przeszukując online znalazłem pewne informacje, ale nic w kontekście opracowania statystycznego lub probabilistycznego modelu / rozwiązania. Bardzo dobrze rozumiem regresję, więc jeśli …
Ok, więc myślę, że mam wystarczająco przyzwoitą próbkę, biorąc pod uwagę ogólną zasadę 20: 1: dość dużą próbkę (N = 374) dla łącznie 7 potencjalnych zmiennych predykcyjnych. Mój problem jest następujący: bez względu na to, jakiego zestawu zmiennych predykcyjnych używam, klasyfikacje nigdy nie są lepsze niż specyficzność 100% i czułość …
Dla przedziału predykcji w regresji liniowej nadal korzystać z E [ Y | x ] = ^ P 0 + β 1 x celu wygenerowania odstępu. Używasz tego również do wygenerowania przedziału ufności E [ Y | x 0 ] . Jaka jest różnica między nimi?mi^[ Y| x]= β0^+ β^1xE^[Y|x]=β0^+β^1x\hat{E}[Y|x] …
Interesuje mnie ręczne obliczanie pola pod krzywą (AUC) lub statystyki c dla binarnego modelu regresji logistycznej. Na przykład w zbiorze danych sprawdzania poprawności mam prawdziwą wartość zmiennej zależnej retencji (1 = zachowane; 0 = nie zachowane), a także przewidywany status retencji dla każdej obserwacji wygenerowanej przez moją analizę regresji przy …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.