Pytania otagowane jako regression-strategies

Strategie modelowania regresji


3
Jakie są kryteria i podejmowane decyzje dotyczące nieliniowości w modelach statystycznych?
Mam nadzieję, że poniższe ogólne pytanie ma sens. Należy pamiętać, że do celów tego konkretnego pytania nie interesują mnie teoretyczne (domena przedmiotowa) powody wprowadzenia nieliniowości. Dlatego sformułuję pełne pytanie w następujący sposób: Jakie są logiczne ramy ( kryteria i, jeśli to możliwe, proces decyzyjny ) dla wprowadzenia nieliniowości do modeli …


2
Jak powinienem modelować interakcje między zmiennymi objaśniającymi, gdy jedna z nich może mieć wyrażenia kwadratowe i sześcienne?
Mam szczerą nadzieję, że sformułowałem to pytanie w taki sposób, że można na nie ostatecznie odpowiedzieć - jeśli nie, proszę dać mi znać, a spróbuję ponownie! Powinienem też chyba zauważyć, że do tych analiz będę używać R. Mam kilka środków, plant performance (Ys)które, jak podejrzewam, były pod wpływem czterech zabiegów, …

3
Jak zmniejszyć predyktory we właściwy sposób dla modelu regresji logistycznej
Czytałem więc kilka książek (lub ich części) na temat modelowania (między innymi „Strategie modelowania regresji” F. Harrella, ponieważ moja obecna sytuacja jest taka, że ​​muszę zrobić model logistyczny oparty na danych binarnych odpowiedzi. W moim zestawie danych mam zarówno dane ciągłe, jakościowe, jak i binarne (predyktory). Zasadniczo mam teraz około …

1
Jak interpretować zmienne wykluczone lub zawarte w modelu lasso?
Z innych postów wyciągnąłem wniosek, że nie można przypisywać „ważności” ani „znaczenia” zmiennym predykcyjnym wchodzącym w model lasso, ponieważ obliczanie wartości p lub odchyleń standardowych tych zmiennych jest wciąż w toku. Czy zgodnie z tym rozumowaniem słuszne jest stwierdzenie, że NIE MOŻNA powiedzieć, że zmienne WYŁĄCZONE z modelu lasso są …

5
Regresja logistyczna dużych zbiorów danych
Mam zestaw danych zawierający około 5000 funkcji. Dla tych danych najpierw użyłem testu Chi Square do wyboru funkcji; potem otrzymałem około 1500 zmiennych, które wykazały związek istotności ze zmienną odpowiedzi. Teraz muszę dopasować do tego regresję logistyczną. Używam pakietu glmulti dla R (pakiet glmulti zapewnia efektywny wybór podzbiorów dla vlm), …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.