Jeśli zaczniemy od zestawu danych , zastosujemy do niego Lasso i uzyskamy rozwiązanie β L , możemy ponownie zastosować Lasso do zbioru danych ( X S , Y ) , gdzie S jest zbiorem niezerowym indeksy β L , aby uzyskać rozwiązanie β R L , zwane „zrelaksowanym rozwiązaniem LASSO” …
Jak wyjaśniono w tym podręczniku kursu (strona 1) , model liniowy można zapisać w postaci: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, gdzie jest zmienną odpowiedzi, a jest zmienną objaśniającą .yyyxixix_{i}ithithi^{th} Często w celu spełnienia założeń testowych można przekształcić zmienną odpowiedzi. Na przykład, stosujemy funkcję …
W regresji lasso lub kalenicy należy określić parametr skurczu, często nazywany przez lub . Ta wartość jest często wybierana poprzez krzyżową weryfikację, sprawdzając kilka różnych wartości danych treningowych i sprawdzając, która daje najlepszą wartość, np. na danych testowych. Jaki zakres wartości należy sprawdzić? Czy to ?λλ\lambdaαα\alphaR2)R2)R^2( 0 , 1 )(0,1)(0,1)
Jakie są wymagania dotyczące stacjonarności stosowania regresji z błędami ARIMA (regresja dynamiczna) do wnioskowania? W szczególności, mam niestacjonarne bezstopniowej wynik , A niestacjonarnym predyktor ciągły x i zmienny obojętne seria leczenia x b . Chciałbym wiedzieć, czy leczenie było skorelowane ze zmianą zmiennej wynikowej, która jest o więcej niż dwa …
Nadal jestem całkiem nowy w uogólnionych modelach liniowych i mam problem z notacją w większości tekstów GLM, które wybrałem. Czy istnieją bardzo popularne książki GLM, które lepiej nadają się do czytelności?
Powiedzmy, że mam regresję wielowymiarową (kilka zmiennych niezależnych), która składa się z 3 zmiennych. Każda z tych zmiennych ma określony współczynnik. Jeśli zdecyduję się wprowadzić czwartą zmienną i ponownie uruchomić regresję, czy zmienią się współczynniki 3 pierwotnych zmiennych? Mówiąc szerzej: czy w regresji wielowymiarowej (wiele zmiennych niezależnych) na współczynnik danej …
Rozważ regresję liniową z pewną regularyzacją: Np. Znajdź który minimalizuje | | A x - b | | 2 + λ | | x | | 1xxx||Ax−b||2+λ||x||1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 Zwykle kolumny A są znormalizowane, aby miały średnią zerową i normę jednostkową, podczas gdy jest wyśrodkowany, aby mieć średnią zerową. Chcę …
Jestem w tym całkiem nowy, więc mam nadzieję, że wybaczysz mi, jeśli pytanie jest naiwne. (Kontekst: Uczę się ekonometrii z książki Davidsona i MacKinnona „Teoria ekonometryczna i metody” i wydaje się, że nie wyjaśniają tego; przyjrzałem się także książce optymalizacyjnej Luenbergera, która zajmuje się projekcjami na nieco bardziej zaawansowanym poziomie, …
Mam klasyczny model liniowy z 5 możliwymi regresorami. Nie są ze sobą skorelowane i mają dość niską korelację z odpowiedzią. Doszedłem do modelu, w którym 3 regresory mają znaczące współczynniki dla ich statystyki t (p <0,05). Dodanie jednej lub obu pozostałych 2 zmiennych daje wartości p> 0,05 dla statystyki t, …
Próbuję zaimplementować analizę „punktu zmiany” lub regresję wielofazową nls()w R. Oto kilka fałszywych danych, które stworzyłem . Formuła, której chcę użyć do dopasowania danych, to: y= β0+ β1x + β2)max ( 0 , x - δ)y=β0+β1x+β2)max(0,x-δ)y = \beta_0 + \beta_1x + \beta_2\max(0,x-\delta) Powinno to polegać na dopasowaniu danych do określonego …
W regresji liniowej (strata kwadratowa) za pomocą macierzy mamy bardzo zwięzłą notację dla celu minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Gdzie AAA to macierz danych, xxx to współczynniki, a bbb to odpowiedź. Czy istnieje podobna notacja macierzowa dla celu regresji logistycznej? Wszystkie oznaczenia widziałem nie może pozbyć się suma nad wszystkimi punktami …
Jaka byłaby „rozsądna” minimalna liczba obserwacji w celu znalezienia trendu w czasie z regresją liniową? co z dopasowaniem modelu kwadratowego? Pracuję ze złożonymi wskaźnikami nierówności w zdrowiu (SII, RII) i mam tylko 4 fale ankiety, czyli 4 punkty (1997,2001,2004,2008). Nie jestem statystykiem, ale mam intuicyjne wrażenie, że 4 punkty nie …
Analizuję zestaw danych przy użyciu modelu efektów mieszanych z jednym ustalonym efektem (warunkiem) i dwoma efektami losowymi (uczestnik ze względu na projekt i parę wewnątrz przedmiotu). Model ten został wygenerowany z lme4pakietu: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Następnie wykonałem test współczynnika wiarygodności tego modelu względem modelu bez ustalonego efektu (warunku) i mam znaczącą różnicę. …
Mam pytanie dotyczące dwóch różnych metod z różnych bibliotek, które wydają się wykonywać tę samą pracę. Próbuję stworzyć model regresji liniowej. Oto kod, który używam biblioteki statsmodel z OLS: X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1) x_train = sm.add_constant(X_train) model = sm.OLS(y_train, x_train) results = model.fit() print "GFT …
http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/ Jeśli spojrzysz na górę tego postu, pisarz wspomina, że norma L2 ma unikalne rozwiązanie, a norma L1 ma prawdopodobnie wiele rozwiązań. Rozumiem to w kategoriach regularyzacji, ale nie w kategoriach użycia normy L1 lub normy L2 w funkcji straty. Jeśli spojrzysz na wykresy funkcji skalarnej x (x ^ 2 …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.