Statystyki i duże zbiory danych model-selection

3

Kiedy należy wybrać modele poprzez zminimalizowanie AIC?

Jest dobrze ustalone, przynajmniej wśród statystyków pewnego wyższego kalibru, że modele z wartościami statystyki AIC mieszczącymi się w pewnym progu wartości minimalnej należy uznać za odpowiednie jako model minimalizujący statystyki AIC. Na przykład w [1, s. 221] znajdujemy Wtedy modele z małym GCV lub AIC będą uważane za najlepsze. Oczywiście …

12 time-series model-selection aic

1

Wybór modelu bayesowskiego w PyMC3

Używam PyMC3 do uruchamiania modeli bayesowskich na moich danych. Jestem nowy w modelowaniu bayesowskim, ale według niektórych postów na blogach , Wikipedii i kontroli jakości z tej witryny wydaje się, że poprawnym podejściem jest zastosowanie współczynnika Bayesa i kryterium BIC, aby móc wybrać model najlepiej reprezentujący moje dane (ten, który …

11 bayesian model-selection pymc

1

Jak wybrać najlepsze dopasowanie bez nadmiernego dopasowania danych? Modelowanie rozkładu bimodalnego za pomocą N normalnych funkcji itp

Mam oczywiście bimodalny rozkład wartości, który staram się dopasować. Dane mogą być dobrze dopasowane do 2 normalnych funkcji (bimodalnych) lub 3 normalnych funkcji. Ponadto istnieje prawdopodobny fizyczny powód dopasowania danych do 3. Im więcej parametrów zostanie wprowadzonych, tym lepsze będzie dopasowanie, ponieważ przy wystarczającej liczbie stałych można „ dopasować słonia …

11 distributions normal-distribution model-selection overfitting

1

Wybór modelu w nauczaniu offline a nauczanie online

Ostatnio próbuję dowiedzieć się więcej na temat uczenia się online (to absolutnie fascynujące!), A jednym z tematów, którego nie byłem w stanie dobrze zrozumieć, jest sposób myślenia o wyborze modelu w kontekście offline i online. Konkretnie, załóżmy, szkolimy klasyfikator w trybie offline, na podstawie pewnego ustalonego zbioru danych . Powiedzmy, …

11 machine-learning model-selection online

1

Co mam zrobić, gdy wartości AIC są niskie i w przybliżeniu równe?

Chris Chatfield, którego wiele wysokiej jakości książek i artykułów lubiłem czytać, w (1) udziela następujących rad: Na przykład prawdopodobnie należy dokonać wyboru między modelami szeregów czasowych ARIMA o niskich i w przybliżeniu równych wartościach AIC, nie na podstawie tego, co daje minimalny AIC, ale na podstawie których można uzyskać najlepsze …

11 forecasting model-selection arima aic

5

Co zrobić ze zmiennymi współliniowymi

Oświadczenie: To jest praca domowa. Próbuję znaleźć najlepszy model dla cen diamentów, w zależności od kilku zmiennych i wydaje mi się, że mam do tej pory całkiem niezły model. Natknąłem się jednak na dwie zmienne, które są oczywiście współliniowe: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 …

11 regression correlation self-study model-selection multicollinearity

1

Wybór modelu ABC

Zostało pokazane , że ABC wybór modelu z użyciem czynników Bayesa nie ma być zalecane ze względu na obecność błędu pochodzących z wykorzystaniem statystyk podsumowujących. Wniosek w tym artykule opiera się na badaniu zachowania popularnej metody aproksymacji współczynnika Bayesa (algorytm 2). Powszechnie wiadomo, że czynniki Bayesa to nie jedyny sposób …

11 bayesian model-selection prediction abc

2

Uogólniony test współczynnika wiarygodności dziennika dla modeli zagnieżdżonych

Rozumiem, że jeśli mam dwa modele A i B, a A jest zagnieżdżone w B, to biorąc pod uwagę pewne dane, mogę dopasować parametry A i B za pomocą MLE i zastosować uogólniony test współczynnika wiarygodności dziennika. W szczególności, rozkład testu należy z stopni swobody, gdzie jest różnicą liczby parametrów …

10 maximum-likelihood model-selection likelihood-ratio

2

Przewaga LASSO nad wyborem do przodu / eliminacją do tyłu pod względem błędu prognozowania walidacji krzyżowej modelu

Otrzymałem trzy zredukowane modele z oryginalnego pełnego modelu przy użyciu wybór do przodu eliminacja wsteczna Technika penalizacji L1 (LASSO) Dla modeli uzyskanych za pomocą selekcji do przodu / eliminacji wstecznej uzyskałem oszacowane krzyżowo oszacowanie błędu prognozowania przy użyciu CVlmpakietu DAAGdostępnego w R. Do modelu wybranego przez LASSO użyłem cv.glm. Błąd …

10 cross-validation model-selection lasso stepwise-regression

1

Jaka jest podstawowa różnica między tymi dwoma modelami regresji?

Załóżmy, że mam odpowiedzi dwuwymiarowe ze znaczną korelacją. Próbuję porównać dwa sposoby modelowania tych wyników. Jednym ze sposobów jest modelowanie różnicy między dwoma wynikami: Innym sposobem jest użycie lub ich: ( y i j = β 0 + czas + X ′ β )(yi2−yi1=β0+X′β)(yi2−yi1=β0+X′β)(y_{i2}-y_{i1}=\beta_0+X'\beta)glsgee(yij=β0+time+X′β)(yij=β0+time+X′β)(y_{ij}=\beta_0+\text{time}+X'\beta) Oto przykład foo: #create foo data …

10 r regression model-selection

3

Porównywanie zagnieżdżonych binarnych modeli regresji logistycznej, gdy jest duże

Aby lepiej zadać moje pytanie, podałem poniżej niektóre wyniki zarówno modelu zmiennego 16 ( fit), jak i modelu zmiennego 17 ( fit2) (wszystkie zmienne predykcyjne w tych modelach są ciągłe, a jedyną różnicą między tymi modelami jest to, że fitnie zawierają zmienną 17 (var17)): fit Model Likelihood Discrimination Rank Discrim. …

10 r regression logistic model-selection large-data

1

Porównanie rozkładów wydajności uogólnienia

Powiedz, że mam dwie metody uczenia się dla problemu klasyfikacji , i , i że oceniam ich wydajność uogólniającą za pomocą czegoś takiego jak wielokrotne sprawdzanie poprawności lub ładowanie początkowe. Z tego procesu otrzymuję rozkład wyników i dla każdej metody w tych powtórzeniach (np. Rozkład wartości ROC AUC dla każdego …

10 cross-validation model-selection

1

Czynniki Bayesa z niewłaściwymi priory

Mam pytanie dotyczące porównania modeli z wykorzystaniem czynników Bayesa. W wielu przypadkach statystycy są zainteresowani zastosowaniem podejścia bayesowskiego z niewłaściwymi priory (na przykład niektóre priory Jeffreysa i referencyjne priory). Moje pytanie brzmi: w tych przypadkach, gdy tylny rozkład parametrów modelu jest dobrze zdefiniowany, czy prawidłowe jest porównywanie modeli przy użyciu …

10 bayesian model-selection prior

1

Pytania dotyczące określenia liniowych modeli mieszanych w R dla danych z powtarzanymi pomiarami z dodatkową strukturą zagnieżdżenia

Struktura danych > str(data) 'data.frame': 6138 obs. of 10 variables: $ RT : int 484 391 422 516 563 531 406 500 516 578 ... $ ASCORE : num 5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ... $ HSCORE : num 6 2.1 7.9 1 6.9 8.9 …

10 r mixed-model repeated-measures model-selection lme4-nlme

2

Stabilność modelu w walidacji krzyżowej modeli regresji

Biorąc pod uwagę wielokrotne sprawdzanie poprawności krzyżowej regresji logistycznej i wynikające z niej wielokrotne oszacowania każdego współczynnika regresji, w jaki sposób należy zmierzyć, czy predyktor (lub zestaw predyktorów) jest / są stabilne i znaczące na podstawie współczynników regresji ? Czy jest inaczej w przypadku regresji liniowej?

10 regression model-selection cross-validation

Pytania otagowane jako model-selection