Znam podstawy SVM i SVR, ale wciąż nie rozumiem, jak problem znalezienia hiperpłaszczyzny, która maksymalizuje margines, pasuje do SVR. Po drugie, przeczytałem coś o używanym jako margines tolerancji w SVR. Co to znaczy?ϵϵ\epsilon Po trzecie, czy jest jakaś różnica między parametrami funkcji decyzyjnej stosowanymi w SVM i SVR?
Czy w przypadku drzew decyzyjnych przewidywana wartość może leżeć poza zakresem danych szkoleniowych? Na przykład, jeśli zakres zestawu danych treningowych zmiennej docelowej wynosi 0-100, to kiedy generuję mój model i stosuję go do czegoś innego, czy moje wartości mogą wynosić -5? lub 150? Biorąc pod uwagę, że rozumiem regresję drzewa …
Szukam zasobów (książek, notatek z wykładów itp.) Na temat technik, które mogą obsługiwać dane, które mają wiele celów (np .: trzy zmienne zależne: 2 dyskretne i 1 ciągłe). Czy ktoś ma jakieś zasoby / wiedzę na ten temat? Wiem, że można do tego wykorzystać sieci neuronowe.
Używam procesu Gaussa (GP) do regresji. W moim problemie dość często zdarza się, że dwa lub więcej punktów danych są blisko siebie, względem długości skale problemu. Obserwacje mogą być również bardzo głośne. Aby przyspieszyć obliczenia i poprawić precyzję pomiaru , naturalne wydaje się łączenie / integrowanie skupisk punktów, które są …
Muszę wyznać, że wcześniej nie słyszałem o tym terminie na żadnej z moich zajęć, na studiach licencjackich ani na studiach. Co to znaczy, że regresja logistyczna jest Bayesowska? Szukam wyjaśnienia z przejściem od logistyki zwykłej do logistyki bayesowskiej podobnej do następującej: Jest to równanie w modelu regresji liniowej: .mi( y) …
Przeglądam sekcję LAB §6.6 na temat regresji grzbietu / Lasso w książce „An Introduction to Statistics Learning with Applications in R” Jamesa, Witten, Hastie, Tibshirani (2013). Mówiąc dokładniej, próbuję zastosować model scikit-learn Ridgedo zestawu danych „Hitters” z pakietu R „ISLR”. Stworzyłem ten sam zestaw funkcji, jak pokazano w kodzie R. …
Podczas modelowania ciągłych proporcji (np. Proporcjonalna pokrywa roślinności w kwadratowych badaniach lub odsetek czasu poświęconego na działanie) regresja logistyczna jest uważana za nieodpowiednią (np. Warton i Hui (2011). Arcsine jest asinine: analiza proporcji w ekologii ). Raczej regresja OLS po przekształceniu logitów proporcji, a może regresja beta, są bardziej odpowiednie. …
Przeprowadziłem regresję Poissona w SAS i stwierdziłem, że wartość chi-kwadrat Pearsona podzielona przez stopnie swobody wynosiła około 5, co wskazuje na znaczną naddyspersję. Tak więc dopasowałem ujemny model dwumianowy do proc genmod i stwierdziłem, że wartość chi-kwadrat Pearsona podzielona przez stopnie swobody wynosi 0,80. Czy jest to obecnie uważane za …
Wyobrażam sobie, że kontrolowanie zmiennej w projekcie badania jest bardziej skuteczne w zmniejszaniu błędu niż kontrolowanie jej post hoc w modelu regresji. Czy ktoś mógłby wyjaśnić formalnie, czym różnią się te dwa przypadki „kontrolowania”? Jak stosunkowo są skuteczne w zmniejszaniu błędów i uzyskiwaniu dokładniejszych prognoz?
Zajmuję się tworzeniem aplikacji do prognozowania, której celem jest umożliwienie importerowi prognozowania popytu na jego produkty z sieci klientów-dystrybutorów. Dane dotyczące sprzedaży są dość dobrym wskaźnikiem popytu, o ile istnieją odpowiednie zapasy, aby zaspokoić popyt. Kiedy jednak zapasy są zmniejszane do zera (sytuacja, w której staramy się pomóc naszemu klientowi …
Próbuję wykonać regresję lasso, która ma następującą postać: Minimalizuj w( Y - X w ) ′ ( Y - X w ) + λwww( Y- Xw )′( Y- Xw ) + λ| w |1(Y−Xw)′(Y−Xw)+λ|w|1(Y - Xw)'(Y - Xw) + \lambda \;|w|_1 Biorąc pod uwagę , doradzono mi, aby znaleźć optymalne …
Dopasowuję regresję do . Czy poprawne jest obliczanie szacunkowych punktów przekształcenia (i przedziałów ufności / prognozowania) przez potęgowanie? Nie wierzę tak, ponieważ E [ f ( X ) ] ≠ f ( E [ X ] ), ale chciał opinii innych.log(y)log(y)\log(y)E[f(X)]≠f(E[X])E[f(X)]≠f(E[X])E[f(X)] \ne f(E[X]) Mój przykład poniżej pokazuje konflikty z transformacją …
Mam badanie, w którym reprezentowanych jest wiele wyników, takich jak procenty, i używam wielu regresji liniowych, aby ocenić wpływ niektórych zmiennych kategorialnych na te wyniki. Zastanawiałem się, skoro regresja liniowa zakłada, że wynikiem jest rozkład ciągły, czy istnieją problemy metodologiczne przy stosowaniu takiego modelu do wartości procentowych, które są ograniczone …
Mam comiesięczny szereg czasowy z interwencją i chciałbym oszacować wpływ tej interwencji na wynik. Zdaję sobie sprawę, że seria jest raczej krótka, a efekt nie jest jeszcze zakończony. Dane cds <- structure(c(2580L, 2263L, 3679L, 3461L, 3645L, 3716L, 3955L, 3362L, 2637L, 2524L, 2084L, 2031L, 2256L, 2401L, 3253L, 2881L, 2555L, 2585L, 3015L, …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.