Statystyki i duże zbiory danych regression

1

Dlaczego „zrelaksowane lasso” różni się od standardowego lasso?

Jeśli zaczniemy od zestawu danych , zastosujemy do niego Lasso i uzyskamy rozwiązanie β L , możemy ponownie zastosować Lasso do zbioru danych ( X S , Y ) , gdzie S jest zbiorem niezerowym indeksy β L , aby uzyskać rozwiązanie β R L , zwane „zrelaksowanym rozwiązaniem LASSO” …

16 regression optimization lasso regularization shrinkage

2

Dlaczego GLM różni się od LM z transformowaną zmienną

Jak wyjaśniono w tym podręczniku kursu (strona 1) , model liniowy można zapisać w postaci: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, gdzie jest zmienną odpowiedzi, a jest zmienną objaśniającą .yyyxixix_{i}ithithi^{th} Często w celu spełnienia założeń testowych można przekształcić zmienną odpowiedzi. Na przykład, stosujemy funkcję …

16 regression generalized-linear-model data-transformation linear-model

1

Jaki jest typowy zakres możliwych wartości parametru skurczu w regresji karanej?

W regresji lasso lub kalenicy należy określić parametr skurczu, często nazywany przez lub . Ta wartość jest często wybierana poprzez krzyżową weryfikację, sprawdzając kilka różnych wartości danych treningowych i sprawdzając, która daje najlepszą wartość, np. na danych testowych. Jaki zakres wartości należy sprawdzić? Czy to ?λλ\lambdaαα\alphaR2)R2)R^2( 0 , 1 )(0,1)(0,1)

16 regression lasso regularization ridge-regression penalized

2

Jakie są wymagania dotyczące stacjonarności stosowania regresji z błędami ARIMA do wnioskowania?

Jakie są wymagania dotyczące stacjonarności stosowania regresji z błędami ARIMA (regresja dynamiczna) do wnioskowania? W szczególności, mam niestacjonarne bezstopniowej wynik , A niestacjonarnym predyktor ciągły x i zmienny obojętne seria leczenia x b . Chciałbym wiedzieć, czy leczenie było skorelowane ze zmianą zmiennej wynikowej, która jest o więcej niż dwa …

16 regression time-series arima stationarity

4

Jaka jest najlepsza książka o uogólnionych modelach liniowych dla nowicjuszy?

Nadal jestem całkiem nowy w uogólnionych modelach liniowych i mam problem z notacją w większości tekstów GLM, które wybrałem. Czy istnieją bardzo popularne książki GLM, które lepiej nadają się do czytelności?

16 regression generalized-linear-model references

3

Czy dodanie większej liczby zmiennych do regresji wielowymiarowej zmienia współczynniki istniejących zmiennych?

Powiedzmy, że mam regresję wielowymiarową (kilka zmiennych niezależnych), która składa się z 3 zmiennych. Każda z tych zmiennych ma określony współczynnik. Jeśli zdecyduję się wprowadzić czwartą zmienną i ponownie uruchomić regresję, czy zmienią się współczynniki 3 pierwotnych zmiennych? Mówiąc szerzej: czy w regresji wielowymiarowej (wiele zmiennych niezależnych) na współczynnik danej …

16 regression multiple-regression multivariable

1

Potrzeba centrowania i standaryzacji danych w regresji

Rozważ regresję liniową z pewną regularyzacją: Np. Znajdź który minimalizuje | | A x - b | | 2 + λ | | x | | 1xxx||Ax−b||2+λ||x||1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 Zwykle kolumny A są znormalizowane, aby miały średnią zerową i normę jednostkową, podczas gdy jest wyśrodkowany, aby mieć średnią zerową. Chcę …

16 regression lasso regularization standardization

2

Dlaczego macierz projekcji ortogonalnej projekcji jest symetryczna?

Jestem w tym całkiem nowy, więc mam nadzieję, że wybaczysz mi, jeśli pytanie jest naiwne. (Kontekst: Uczę się ekonometrii z książki Davidsona i MacKinnona „Teoria ekonometryczna i metody” i wydaje się, że nie wyjaśniają tego; przyjrzałem się także książce optymalizacyjnej Luenbergera, która zajmuje się projekcjami na nieco bardziej zaawansowanym poziomie, …

16 regression least-squares

4

Klasyczny model liniowy - wybór modelu

Mam klasyczny model liniowy z 5 możliwymi regresorami. Nie są ze sobą skorelowane i mają dość niską korelację z odpowiedzią. Doszedłem do modelu, w którym 3 regresory mają znaczące współczynniki dla ich statystyki t (p <0,05). Dodanie jednej lub obu pozostałych 2 zmiennych daje wartości p> 0,05 dla statystyki t, …

16 r regression self-study linear-model

2

Analiza punktu zmiany za pomocą R's nls ()

Próbuję zaimplementować analizę „punktu zmiany” lub regresję wielofazową nls()w R. Oto kilka fałszywych danych, które stworzyłem . Formuła, której chcę użyć do dopasowania danych, to: y= β0+ β1x + β2)max ( 0 , x - δ)y=β0+β1x+β2)max(0,x-δ)y = \beta_0 + \beta_1x + \beta_2\max(0,x-\delta) Powinno to polegać na dopasowaniu danych do określonego …

16 r regression change-point nls

2

Notacja macierzowa dla regresji logistycznej

W regresji liniowej (strata kwadratowa) za pomocą macierzy mamy bardzo zwięzłą notację dla celu minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Gdzie AAA to macierz danych, xxx to współczynniki, a bbb to odpowiedź. Czy istnieje podobna notacja macierzowa dla celu regresji logistycznej? Wszystkie oznaczenia widziałem nie może pozbyć się suma nad wszystkimi punktami …

16 regression logistic linear-model notation

1

Minimalna liczba punktów dla regresji liniowej

Jaka byłaby „rozsądna” minimalna liczba obserwacji w celu znalezienia trendu w czasie z regresją liniową? co z dopasowaniem modelu kwadratowego? Pracuję ze złożonymi wskaźnikami nierówności w zdrowiu (SII, RII) i mam tylko 4 fale ankiety, czyli 4 punkty (1997,2001,2004,2008). Nie jestem statystykiem, ale mam intuicyjne wrażenie, że 4 punkty nie …

16 regression

1

Jakiej metody wielokrotnego porównania użyć w modelu Lmer: lsmeans czy glht?

Analizuję zestaw danych przy użyciu modelu efektów mieszanych z jednym ustalonym efektem (warunkiem) i dwoma efektami losowymi (uczestnik ze względu na projekt i parę wewnątrz przedmiotu). Model ten został wygenerowany z lme4pakietu: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Następnie wykonałem test współczynnika wiarygodności tego modelu względem modelu bez ustalonego efektu (warunku) i mam znaczącą różnicę. …

16 r repeated-measures multiple-comparisons post-hoc lsmeans bayesian posterior marginal integral anova time-series regularization machine-learning pca computational-statistics references inference regression cross-validation python random-forest chi-squared spearman-rho r machine-learning confidence-interval bagging clustering feature-selection model-selection bic hypothesis-testing kurtosis r regression residuals terminology

3

Różnica między statsmodel OLS a regresją liniową scikit

Mam pytanie dotyczące dwóch różnych metod z różnych bibliotek, które wydają się wykonywać tę samą pracę. Próbuję stworzyć model regresji liniowej. Oto kod, który używam biblioteki statsmodel z OLS: X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1) x_train = sm.add_constant(X_train) model = sm.OLS(y_train, x_train) results = model.fit() print "GFT …

16 regression python scikit-learn statsmodels

2

Dlaczego utrata normy L2 ma unikalne rozwiązanie, a utrata normy L1 ma prawdopodobnie wiele rozwiązań?

http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/ Jeśli spojrzysz na górę tego postu, pisarz wspomina, że norma L2 ma unikalne rozwiązanie, a norma L1 ma prawdopodobnie wiele rozwiązań. Rozumiem to w kategoriach regularyzacji, ale nie w kategoriach użycia normy L1 lub normy L2 w funkcji straty. Jeśli spojrzysz na wykresy funkcji skalarnej x (x ^ 2 …

16 regression lasso regularization

Pytania otagowane jako regression