Statystyki i duże zbiory danych regression

1

Czym różni się regresja wektora wsparcia od SVM?

Znam podstawy SVM i SVR, ale wciąż nie rozumiem, jak problem znalezienia hiperpłaszczyzny, która maksymalizuje margines, pasuje do SVR. Po drugie, przeczytałem coś o używanym jako margines tolerancji w SVR. Co to znaczy?ϵϵ\epsilon Po trzecie, czy jest jakaś różnica między parametrami funkcji decyzyjnej stosowanymi w SVM i SVR?

11 regression machine-learning svm

2

Drzewa decyzyjne i regresja - czy przewidywane wartości mogą znajdować się poza zakresem danych treningowych?

Czy w przypadku drzew decyzyjnych przewidywana wartość może leżeć poza zakresem danych szkoleniowych? Na przykład, jeśli zakres zestawu danych treningowych zmiennej docelowej wynosi 0-100, to kiedy generuję mój model i stosuję go do czegoś innego, czy moje wartości mogą wynosić -5? lub 150? Biorąc pod uwagę, że rozumiem regresję drzewa …

11 regression predictive-models random-forest cart

3

Materiały do nauki o technikach wielu celów?

Szukam zasobów (książek, notatek z wykładów itp.) Na temat technik, które mogą obsługiwać dane, które mają wiele celów (np .: trzy zmienne zależne: 2 dyskretne i 1 ciągłe). Czy ktoś ma jakieś zasoby / wiedzę na ten temat? Wiem, że można do tego wykorzystać sieci neuronowe.

11 regression machine-learning predictive-models references

2

Scalanie obserwacji w procesie Gaussa

Używam procesu Gaussa (GP) do regresji. W moim problemie dość często zdarza się, że dwa lub więcej punktów danych są blisko siebie, względem długości skale problemu. Obserwacje mogą być również bardzo głośne. Aby przyspieszyć obliczenia i poprawić precyzję pomiaru , naturalne wydaje się łączenie / integrowanie skupisk punktów, które są …

11 regression machine-learning gaussian-process

2

Bayesowski model logitów - intuicyjne wyjaśnienie?

Muszę wyznać, że wcześniej nie słyszałem o tym terminie na żadnej z moich zajęć, na studiach licencjackich ani na studiach. Co to znaczy, że regresja logistyczna jest Bayesowska? Szukam wyjaśnienia z przejściem od logistyki zwykłej do logistyki bayesowskiej podobnej do następującej: Jest to równanie w modelu regresji liniowej: .mi( y) …

11 regression logistic bayesian multiple-regression generalized-linear-model

2

Jakie są różnice między regresją Ridge'a przy użyciu glmnet R i scikit-learn Pythona?

Przeglądam sekcję LAB §6.6 na temat regresji grzbietu / Lasso w książce „An Introduction to Statistics Learning with Applications in R” Jamesa, Witten, Hastie, Tibshirani (2013). Mówiąc dokładniej, próbuję zastosować model scikit-learn Ridgedo zestawu danych „Hitters” z pakietu R „ISLR”. Stworzyłem ten sam zestaw funkcji, jak pokazano w kodzie R. …

11 r machine-learning scikit-learn regression

2

Kiedy współczynniki szacowane za pomocą regresji logistycznej i logit-liniowej różnią się?

Podczas modelowania ciągłych proporcji (np. Proporcjonalna pokrywa roślinności w kwadratowych badaniach lub odsetek czasu poświęconego na działanie) regresja logistyczna jest uważana za nieodpowiednią (np. Warton i Hui (2011). Arcsine jest asinine: analiza proporcji w ekologii ). Raczej regresja OLS po przekształceniu logitów proporcji, a może regresja beta, są bardziej odpowiednie. …

11 r regression logistic

1

R - Regresja Lasso - inna Lambda na regresor

Chcę wykonać następujące czynności: 1) Regresja OLS (bez kary), aby uzyskać współczynniki beta ; oznacza zmienne użyte do regresji. Robię to przezb∗jbj∗b_{j}^{*}jjj lm.model = lm(y~ 0 + x) betas = coefficients(lm.model) 2) Regresja Lasso z terminem karnym, kryteriami wyboru są Bayesowskie Kryteria Informacyjne (BIC), podane przez λj=log(T)T|b∗j|λj=log⁡(T)T|bj∗|\lambda _{j} = \frac{\log …

11 r regression glmnet lars

1

Nadmierna i niska dyspersja w ujemnej regresji dwumianowej / regresji Poissona

Przeprowadziłem regresję Poissona w SAS i stwierdziłem, że wartość chi-kwadrat Pearsona podzielona przez stopnie swobody wynosiła około 5, co wskazuje na znaczną naddyspersję. Tak więc dopasowałem ujemny model dwumianowy do proc genmod i stwierdziłem, że wartość chi-kwadrat Pearsona podzielona przez stopnie swobody wynosi 0,80. Czy jest to obecnie uważane za …

11 regression binomial underdispersion

1

Jaka jest różnica między kontrolowaniem zmiennej w modelu regresji a kontrolowaniem zmiennej w projekcie badania?

Wyobrażam sobie, że kontrolowanie zmiennej w projekcie badania jest bardziej skuteczne w zmniejszaniu błędu niż kontrolowanie jej post hoc w modelu regresji. Czy ktoś mógłby wyjaśnić formalnie, czym różnią się te dwa przypadki „kontrolowania”? Jak stosunkowo są skuteczne w zmniejszaniu błędów i uzyskiwaniu dokładniejszych prognoz?

11 regression experiment-design controlling-for-a-variable

1

Korzystanie ze standardowych narzędzi uczenia maszynowego na danych ocenzurowanych po lewej stronie

Zajmuję się tworzeniem aplikacji do prognozowania, której celem jest umożliwienie importerowi prognozowania popytu na jego produkty z sieci klientów-dystrybutorów. Dane dotyczące sprzedaży są dość dobrym wskaźnikiem popytu, o ile istnieją odpowiednie zapasy, aby zaspokoić popyt. Kiedy jednak zapasy są zmniejszane do zera (sytuacja, w której staramy się pomóc naszemu klientowi …

11 r regression machine-learning censoring

2

Programowanie kwadratowe i Lasso

Próbuję wykonać regresję lasso, która ma następującą postać: Minimalizuj w( Y - X w ) ′ ( Y - X w ) + λwww( Y- Xw )′( Y- Xw ) + λ| w |1(Y−Xw)′(Y−Xw)+λ|w|1(Y - Xw)'(Y - Xw) + \lambda \;|w|_1 Biorąc pod uwagę , doradzono mi, aby znaleźć optymalne …

11 regression lasso quadratic-form

1

Wyniki regresji transformacji wstecznej podczas modelowania dziennika (y)

Dopasowuję regresję do . Czy poprawne jest obliczanie szacunkowych punktów przekształcenia (i przedziałów ufności / prognozowania) przez potęgowanie? Nie wierzę tak, ponieważ E [ f ( X ) ] ≠ f ( E [ X ] ), ale chciał opinii innych.log(y)log⁡(y)\log(y)E[f(X)]≠f(E[X])E[f(X)]≠f(E[X])E[f(X)] \ne f(E[X]) Mój przykład poniżej pokazuje konflikty z transformacją …

11 regression back-transformation

3

Jakie są problemy ze stosowaniem wyniku procentowego w regresji liniowej?

Mam badanie, w którym reprezentowanych jest wiele wyników, takich jak procenty, i używam wielu regresji liniowych, aby ocenić wpływ niektórych zmiennych kategorialnych na te wyniki. Zastanawiałem się, skoro regresja liniowa zakłada, że wynikiem jest rozkład ciągły, czy istnieją problemy metodologiczne przy stosowaniu takiego modelu do wartości procentowych, które są ograniczone …

11 regression ratio percentage

3

Funkcja transferu interwencji ARIMA - Jak wizualizować efekt

Mam comiesięczny szereg czasowy z interwencją i chciałbym oszacować wpływ tej interwencji na wynik. Zdaję sobie sprawę, że seria jest raczej krótka, a efekt nie jest jeszcze zakończony. Dane cds <- structure(c(2580L, 2263L, 3679L, 3461L, 3645L, 3716L, 3955L, 3362L, 2637L, 2524L, 2084L, 2031L, 2256L, 2401L, 3253L, 2881L, 2555L, 2585L, 3015L, …

11 r regression arima intervention-analysis

Pytania otagowane jako regression