Splajny są funkcjami elastycznymi, połączonymi razem z części wielomianowych, używanymi do aproksymacji lub wygładzania. Ten znacznik jest przeznaczony dla każdego rodzaju splajnu (np. Splajny B, splajny regresyjne, splajny cienkościenne itp.).
Kontekst : Chcę, aby narysować linię na wykresie rozrzutu, że nie pojawia się parametryczne, dlatego używam geom_smooth()w ggplotw R. Automatycznie zwraca geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to change the smoothing method., …
Mam zestaw danych, który zawiera, powiedzmy, kilka pomiarów pozycji, prędkości i przyspieszenia. Wszystkie pochodzą z tego samego „biegu”. Mógłbym zbudować układ liniowy i dopasować wielomian do wszystkich tych pomiarów. Ale czy mogę zrobić to samo z splajnami? W jaki sposób można to zrobić? Oto kilka symulowanych danych, które chciałbym dopasować: …
Jestem mylony z założeniem liniowości logitu dla ciągłych zmiennych predykcyjnych w analizie regresji logistycznej. Czy musimy sprawdzać zależność liniową podczas przeszukiwania potencjalnych predyktorów przy użyciu analizy regresji logistycznej z jedną zmienną? W moim przypadku używam analizy wielokrotnej regresji logistycznej do identyfikacji czynników związanych ze stanem odżywiania (dychotomiczny wynik) wśród uczestników. …
Czy to źle, że splajny są dostępne tylko w modelach GAM, a nie w modelach GLM? Słyszałem to jakiś czas temu i zastanawiam się, czy to tylko nieporozumienie, czy też ma w tym trochę prawdy. Oto ilustracja:
Podczas korzystania z naturalnych (tj. Ograniczonych) splajnów sześciennych, tworzone funkcje podstawowe są wysoce współliniowe, a po zastosowaniu w regresji wydają się generować bardzo wysokie statystyki VIF (współczynnik inflacji wariancji), sygnalizując wielokoliniowość. Czy rozważając przypadek modelu do celów prognozowania, jest to problem? Wydaje się, że zawsze tak będzie ze względu na …
Mam trochę kodu i danych wyjściowych i chciałbym zbudować model. Nie wiem, jak zbudować model przy użyciu tego wyjścia: require("splines") x <- c(0.2, 0.23, 0.26, 0.29, 0.33, 0.46, 0.53 ) y <- c(0.211, 0.2026, 0.2034, 0.2167, 0.2177, 0.19225, 0.182) fit <- lm(y ~ ns(x,3)) summary(fit) Zauważ, że ns()generuje macierz bazową …
Czy ktoś może pomóc w wyjaśnieniu pojęciowym, w jaki sposób tworzone są prognozy dla nowych danych, gdy stosuje się wygładzanie / splajny dla modelu predykcyjnego? Na przykład, biorąc pod uwagę model stworzony przy użyciu gamboostw mboostopakowaniu w R, p-splajnów, jak są prognozy dla nowych danych? Czego używa dane szkoleniowe? Powiedzmy, …
Dużo czytam o używaniu splajnów w różnych problemach z regresją. Niektóre książki (np. Bogato sparametryzowane modele liniowe Hodgesa ) zalecają splajnowane splajny. Inne (np. Strategie modelowania regresji Harrella ) wybierają ograniczone splajny sześcienne. Jak różne są one w praktyce? Czy często uzyskiwałbyś zasadniczo odmienne wyniki od korzystania z jednego lub …
Przeczytałem więc kilka postów o tym, dlaczego zawsze należy unikać binowania. Popularnym odniesieniem dla tego roszczenia jest ten link . Główną kwestią jest to, że punkty binningu (lub punkty odcięcia) są raczej arbitralne, jak również wynikająca z tego utrata informacji, i że splajny powinny być preferowane. Jednak obecnie pracuję z …
Nie mam na myśli konkretnego przykładu ani zadania. Po prostu jestem nowy w używaniu splajnów b i chciałem lepiej zrozumieć tę funkcję w kontekście regresji. Załóżmy, że chcemy ocenić związek między zmienną odpowiedzi a niektórymi predyktorami . Predyktory obejmują niektóre zmienne numeryczne, a także niektóre jakościowe.yyyx1, x2), . . . …
W komentarzu do tego pytania użytkownik @whuber wskazał na możliwość używania okresowej wersji splajnów w celu dopasowania danych okresowych. Chciałbym dowiedzieć się więcej o tej metodzie, w szczególności o równaniach definiujących splajny oraz o tym, jak je zaimplementować w praktyce (jestem głównie Rużytkownikiem, ale jeśli zajdzie taka potrzeba, poradzę sobie …
Mam kilka zmiennych i jestem zainteresowany znalezieniem między nimi nieliniowych zależności. Postanowiłem więc dopasować trochę splajnu lub lessa i wydrukować ładne wykresy (patrz kod poniżej). Ale chcę też mieć statystyki, które dają mi pojęcie, jak duże jest prawdopodobieństwo, że związek jest kwestią losowości ... tj. Potrzebuję pewnej ogólnej wartości p, …
Pracuję nad zestawem danych. Po zastosowaniu niektórych technik identyfikacji modelu, wyszłam z modelem ARIMA (0,2,1). Użyłem detectIOfunkcji w pakiecie TSAw R do wykrycia innowacyjnej wartości odstającej (IO) przy 48. obserwacji mojego oryginalnego zestawu danych. Jak włączyć tę wartość odstającą do mojego modelu, aby móc jej używać do celów prognozowania? Nie …
Jeśli dopasuję moje dane do czegoś podobnego lm(y~a*b), w składni R, gdzie ajest zmienną binarną i bzmienną numeryczną, to a:btermin interakcji jest różnicą między nachyleniem y~bat a= 0 i at a= 1. Teraz załóżmy, że relacje między yi bjest krzywoliniowy. Jeśli teraz pasuję lm(y~a*poly(b,2)), to a:poly(b,2)1jest zmiana zmiany y~bwarunkowej na …
P: Dla jakich danych właściwe jest stosowanie modelowania w przestrzeni stanów i filtrowania Kalmana zamiast wygładzania splajnów i odwrotnie? Czy istnieje jakaś relacja równoważności między nimi? Próbuję uzyskać ogólne zrozumienie, w jaki sposób te metody pasują do siebie. Przeglądałem nowe oszacowanie Gaussa: Modele sekwencyjne i wielorozdzielcze Johnstone'a . Zaskakujące było …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.