Statystyki i duże zbiory danych splines

1

Kontekst : Chcę, aby narysować linię na wykresie rozrzutu, że nie pojawia się parametryczne, dlatego używam geom_smooth()w ggplotw R. Automatycznie zwraca geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method., …

14 r gam splines loess r data-visualization boxplot mathematical-statistics theory sufficient-statistics machine-learning classification correlation svm feature-selection probability stochastic-processes machine-learning reinforcement-learning

3

Jak dopasować splajn do danych zawierających wartości i 1. / 2. pochodną?

Mam zestaw danych, który zawiera, powiedzmy, kilka pomiarów pozycji, prędkości i przyspieszenia. Wszystkie pochodzą z tego samego „biegu”. Mógłbym zbudować układ liniowy i dopasować wielomian do wszystkich tych pomiarów. Ale czy mogę zrobić to samo z splajnami? W jaki sposób można to zrobić? Oto kilka symulowanych danych, które chciałbym dopasować: …

14 r model fitting splines derivative

4

Jak powinienem sprawdzić założenie liniowości logitu dla ciągłych zmiennych niezależnych w analizie regresji logistycznej?

Jestem mylony z założeniem liniowości logitu dla ciągłych zmiennych predykcyjnych w analizie regresji logistycznej. Czy musimy sprawdzać zależność liniową podczas przeszukiwania potencjalnych predyktorów przy użyciu analizy regresji logistycznej z jedną zmienną? W moim przypadku używam analizy wielokrotnej regresji logistycznej do identyfikacji czynników związanych ze stanem odżywiania (dychotomiczny wynik) wśród uczestników. …

13 regression logistic assumptions splines regression-strategies

2

Splajny w GLM i GAM

Czy to źle, że splajny są dostępne tylko w modelach GAM, a nie w modelach GLM? Słyszałem to jakiś czas temu i zastanawiam się, czy to tylko nieporozumienie, czy też ma w tym trochę prawdy. Oto ilustracja:

12 generalized-linear-model splines

1

Czy występuje problem z wielokoliniowością i regresją splajnów?

Podczas korzystania z naturalnych (tj. Ograniczonych) splajnów sześciennych, tworzone funkcje podstawowe są wysoce współliniowe, a po zastosowaniu w regresji wydają się generować bardzo wysokie statystyki VIF (współczynnik inflacji wariancji), sygnalizując wielokoliniowość. Czy rozważając przypadek modelu do celów prognozowania, jest to problem? Wydaje się, że zawsze tak będzie ze względu na …

12 multiple-regression generalized-linear-model predictive-models multicollinearity splines

1

Jak przełożyć wyjście z dopasowania lm () z splajnem sześciennym na równanie regresji

Mam trochę kodu i danych wyjściowych i chciałbym zbudować model. Nie wiem, jak zbudować model przy użyciu tego wyjścia: require("splines") x <- c(0.2, 0.23, 0.26, 0.29, 0.33, 0.46, 0.53 ) y <- c(0.211, 0.2026, 0.2034, 0.2167, 0.2177, 0.19225, 0.182) fit <- lm(y ~ ns(x,3)) summary(fit) Zauważ, że ns()generuje macierz bazową …

12 r splines

1

Jak przewidywać nowe dane za pomocą regresji spline / smooth

Czy ktoś może pomóc w wyjaśnieniu pojęciowym, w jaki sposób tworzone są prognozy dla nowych danych, gdy stosuje się wygładzanie / splajny dla modelu predykcyjnego? Na przykład, biorąc pod uwagę model stworzony przy użyciu gamboostw mboostopakowaniu w R, p-splajnów, jak są prognozy dla nowych danych? Czego używa dane szkoleniowe? Powiedzmy, …

11 regression machine-learning predictive-models splines

1

Jak różne są splajny sześcienne ograniczone i splajny karane?

Dużo czytam o używaniu splajnów w różnych problemach z regresją. Niektóre książki (np. Bogato sparametryzowane modele liniowe Hodgesa ) zalecają splajnowane splajny. Inne (np. Strategie modelowania regresji Harrella ) wybierają ograniczone splajny sześcienne. Jak różne są one w praktyce? Czy często uzyskiwałbyś zasadniczo odmienne wyniki od korzystania z jednego lub …

11 regression splines

5

Dlaczego za wszelką cenę należy unikać binowania?

Przeczytałem więc kilka postów o tym, dlaczego zawsze należy unikać binowania. Popularnym odniesieniem dla tego roszczenia jest ten link . Główną kwestią jest to, że punkty binningu (lub punkty odcięcia) są raczej arbitralne, jak również wynikająca z tego utrata informacji, i że splajny powinny być preferowane. Jednak obecnie pracuję z …

10 classification categorical-data continuous-data splines binning

2

B-splajny VS wielomiany wysokiego rzędu w regresji

Nie mam na myśli konkretnego przykładu ani zadania. Po prostu jestem nowy w używaniu splajnów b i chciałem lepiej zrozumieć tę funkcję w kontekście regresji. Załóżmy, że chcemy ocenić związek między zmienną odpowiedzi a niektórymi predyktorami . Predyktory obejmują niektóre zmienne numeryczne, a także niektóre jakościowe.yyyx1, x2), . . . …

10 regression multiple-regression splines polynomial penalized

1

Okresowe splajny w celu dopasowania danych okresowych

W komentarzu do tego pytania użytkownik @whuber wskazał na możliwość używania okresowej wersji splajnów w celu dopasowania danych okresowych. Chciałbym dowiedzieć się więcej o tej metodzie, w szczególności o równaniach definiujących splajny oraz o tym, jak je zaimplementować w praktyce (jestem głównie Rużytkownikiem, ale jeśli zajdzie taka potrzeba, poradzę sobie …

10 regression time-series seasonality splines

1

Jak znaleźć wartość p regresji gładkiego splajnu / lessa?

Mam kilka zmiennych i jestem zainteresowany znalezieniem między nimi nieliniowych zależności. Postanowiłem więc dopasować trochę splajnu lub lessa i wydrukować ładne wykresy (patrz kod poniżej). Ale chcę też mieć statystyki, które dają mi pojęcie, jak duże jest prawdopodobieństwo, że związek jest kwestią losowości ... tj. Potrzebuję pewnej ogólnej wartości p, …

10 r regression splines loess

1

Jak włączyć innowacyjną wartość odstającą przy obserwacji 48 w moim modelu ARIMA?

Pracuję nad zestawem danych. Po zastosowaniu niektórych technik identyfikacji modelu, wyszłam z modelem ARIMA (0,2,1). Użyłem detectIOfunkcji w pakiecie TSAw R do wykrycia innowacyjnej wartości odstającej (IO) przy 48. obserwacji mojego oryginalnego zestawu danych. Jak włączyć tę wartość odstającą do mojego modelu, aby móc jej używać do celów prognozowania? Nie …

10 r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

1

Co oznaczają interakcje wyrazów splajnowych i nielinearowych?

Jeśli dopasuję moje dane do czegoś podobnego lm(y~a*b), w składni R, gdzie ajest zmienną binarną i bzmienną numeryczną, to a:btermin interakcji jest różnicą między nachyleniem y~bat a= 0 i at a= 1. Teraz załóżmy, że relacje między yi bjest krzywoliniowy. Jeśli teraz pasuję lm(y~a*poly(b,2)), to a:poly(b,2)1jest zmiana zmiany y~bwarunkowej na …

10 r multiple-regression splines

1

Filtr Kalmana a wygładzanie splajnów

P: Dla jakich danych właściwe jest stosowanie modelowania w przestrzeni stanów i filtrowania Kalmana zamiast wygładzania splajnów i odwrotnie? Czy istnieje jakaś relacja równoważności między nimi? Próbuję uzyskać ogólne zrozumienie, w jaki sposób te metody pasują do siebie. Przeglądałem nowe oszacowanie Gaussa: Modele sekwencyjne i wielorozdzielcze Johnstone'a . Zaskakujące było …

10 kalman-filter splines state-space-models

Pytania otagowane jako splines