Pytania otagowane jako modeling

Ten znacznik opisuje proces tworzenia modelu statystycznego lub uczenia maszynowego. Zawsze dodawaj bardziej szczegółowy tag.



1
Współczynniki regresji, czyli pytania o Kronmal
Niedawno losowe przeglądanie pytań wywołało wspomnienie podpowiedzi jednego z moich profesorów sprzed kilku lat ostrzegających o stosowaniu współczynników w modelach regresji. Zacząłem więc o tym czytać, prowadząc ostatecznie do Kronmal 1993. Chcę się upewnić, że poprawnie interpretuję jego sugestie dotyczące sposobu ich modelowania. Dla modelu o stosunku o tym samym …

2
Model szacowania gęstości zaludnienia
Baza danych (populacja, powierzchnia, kształt) może być wykorzystana do mapowania gęstości zaludnienia poprzez przypisanie stałej wartości populacji / obszaru do każdego kształtu (który jest wielokątem, takim jak blok spisu, obszar, okręg, stan, cokolwiek innego). Jednak populacje zwykle nie są równomiernie rozmieszczone w obrębie swoich wielokątów. Mapowanie dasymetryczne to proces udoskonalania …

2
Wyjaśnij dostosowanie modelu, w prostym języku angielskim
Czytając o metodach i wynikach analizy statystycznej, szczególnie w epidemiologii, bardzo często słyszę o dostosowaniu lub kontroli modeli. Jak wytłumaczyłbyś niestatystycznemu cel tego? Jak interpretujesz swoje wyniki po kontrolowaniu pewnej zmiennej? Mały spacer po Stata lub R, lub wskaźnik do jednego online, byłby prawdziwym klejnotem.

3
Zastąpienie zmiennych WoE (waga dowodu) w regresji logistycznej
To pytanie dotyczy praktyki lub metody stosowanej przez niektórych moich kolegów. Podczas tworzenia modelu regresji logistycznej widziałem, jak ludzie zastępują zmienne kategoryczne (lub zmienne ciągłe, które są binowane) ich odpowiednią wagą dowodu (WoE). Podobno ma to na celu ustanowienie monotonicznej relacji między regresorem a zmienną zależną. O ile rozumiem, po …

2
Czy przewidywanie jest „złotym kryterium” do oceny zdolności statystycznych?
W zeszły weekend czytałem podręczniki modeli liniowych Faraway z R (1. edycja). Faraway miał rozdział zatytułowany „Strategia statystyczna i niepewność modelu”. Opisał (strona 158), że sztucznie wygenerowany niektóre dane przy użyciu bardzo skomplikowany model, a następnie poprosił swoich uczniów do modelowania danych i porównać studentów przewidywanych wyników vs odczytu wyników. …

1
Parametry a zmienne ukryte
Pytałem o to wcześniej i naprawdę miałem problemy z określeniem, co czyni parametr modelu, a co czyni go zmienną ukrytą. Więc patrząc na różne wątki na ten temat na tej stronie, głównym rozróżnieniem wydaje się być: Zmienne utajone nie są obserwowane, ale mają z nimi powiązany rozkład prawdopodobieństwa, ponieważ są …

1
Błąd addytywny czy błąd mnożenia?
Jestem stosunkowo nowy w statystyce i byłbym wdzięczny za pomoc w lepszym zrozumieniu tego. W mojej dziedzinie znajduje się powszechnie stosowany model formularza: P.t= Po( Vt)αPt=Po(Vt)αP_t = P_o(V_t)^\alpha Kiedy ludzie dopasowują model do danych, zwykle linearyzują go i dopasowują do poniższych log( Pt) = log( Po) + dziennik α( Vt) …


1
Techniki analizy wskaźników
Szukam porad i komentarzy dotyczących analizy wskaźników i stawek. W dziedzinie, w której pracuję, analiza wskaźników jest powszechna, ale przeczytałem kilka artykułów, które sugerują, że może to być problematyczne, myślę o: Kronmal, Richard A. 1993. Ponownie zbadano fałszywą korelację i błędność standardu współczynnika. Journal of Royal Statistics Society Series A …

2
Komplikacje posiadania bardzo małej próbki w modelu równań strukturalnych
Korzystam z modelu równań strukturalnych (SEM) w Amos 18. Szukałem 100 uczestników do mojego eksperymentu (używanego luźno), który prawdopodobnie został uznany za niewystarczający do przeprowadzenia udanego SEM. Wielokrotnie mówiono mi, że SEM (wraz z EFA, CFA) jest procedurą statystyczną „dużej próby”. Krótko mówiąc, nie dotarłem do 100 uczestników (co za …

1
LARS vs zejście współrzędnych dla lasso
Jakie są zalety i wady korzystania z LARS [1] w porównaniu ze stosowaniem opadania współrzędnych w celu dopasowania regresji liniowej regulowanej przez L1? Interesują mnie głównie aspekty wydajności (moje problemy występują zwykle Nw setkach tysięcy i p<20). Jednak wszelkie inne spostrzeżenia byłyby również mile widziane. edytuj: Od kiedy opublikowałem pytanie, …

5
Kiedy używać wielu modeli do prognozowania?
To jest dość ogólne pytanie: Zazwyczaj stwierdziłem, że użycie wielu różnych modeli przewyższa jeden model, gdy próbuję przewidzieć szereg czasowy na podstawie próby. Czy są jakieś dobre dokumenty, które pokazują, że kombinacja modeli przewyższy pojedynczy model? Czy istnieją jakieś najlepsze praktyki dotyczące łączenia wielu modeli? Niektóre referencje: Hui Zoua, Yuhong …

1
Pakiet GBM vs. Caret korzystający z GBM
Stroiłem model przy użyciu caret, ale potem ponownie uruchomiłem model przy użyciu gbmpakietu. Rozumiem, że caretpakiet używa gbmi wynik powinien być taki sam. Jednak tylko szybki test przy użyciu data(iris)wykazuje rozbieżność w modelu około 5% przy użyciu RMSE i R ^ 2 jako metryki oceny. Chcę znaleźć optymalną wydajność modelu …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.