Mam zestaw danych z trzema zmiennymi, gdzie wszystkie zmienne są liczbowe. Nazwijmy to , i . Dopasowuję model regresji z perspektywy Bayesa za pomocą MCMCrjags
Zrobiłem analizę eksploracyjną, a wykres rozrzutu sugeruje, że należy użyć wyrażenia kwadratowego. Następnie zamontowałem dwa modele
(1)
(2)
W modelu 1 wielkość efektu każdego parametru nie jest mała, a przedział wiarygodności 95% nie zawiera wartości .
W modelu 2 wielkość efektu parametrów i są małe i każdy z wiarygodnych przedziałów dla wszystkich parametrów zawiera .
Fakt, że wiarygodny przedział zawiera wystarczy, aby powiedzieć, że parametr nie jest istotny?
Następnie dostosowałem następujący model
(3)
Wielkość efektu każdego parametru nie jest mała, ale z wyjątkiem wszystkie wiarygodne interwały zawierają .
Jaki jest właściwy sposób dokonywania wyboru zmiennych w statystyce bayesowskiej?
EDYCJA: Czy mogę używać Lasso w dowolnym modelu regresji, takim jak model Beta? Używam modelu ze zmiennym rozrzutem gdzie
EDYCJA 2: Dopasowałem dwa modele, jeden z apr. Gaussa dla, i jeden z Laplace'em (podwójnie wykładniczy).
Szacunki dla modelu Gaussa to
Mean SD Naive SE Time-series SE
B[1] -1.17767 0.07112 0.0007497 0.0007498
B[2] -0.15624 0.03916 0.0004128 0.0004249
B[3] 0.15600 0.05500 0.0005797 0.0005889
B[4] 0.07682 0.04720 0.0004975 0.0005209
delta[1] -3.42286 0.32934 0.0034715 0.0034712
delta[2] 0.06329 0.27480 0.0028966 0.0028969
delta[3] 1.06856 0.34547 0.0036416 0.0036202
delta[4] -0.32392 0.26944 0.0028401 0.0028138
Szacunki dla modelu Lasso to
Mean SD Naive SE Time-series SE
B[1] -1.143644 0.07040 0.0007421 0.0007422
B[2] -0.160541 0.05341 0.0005630 0.0005631
B[3] 0.137026 0.05642 0.0005947 0.0005897
B[4] 0.046538 0.04770 0.0005028 0.0005134
delta[1] -3.569151 0.27840 0.0029346 0.0029575
delta[2] -0.004544 0.15920 0.0016781 0.0016786
delta[3] 0.411220 0.33422 0.0035230 0.0035629
delta[4] -0.034870 0.16225 0.0017103 0.0017103
lambda 7.269359 5.45714 0.0575233 0.0592808
Szacunki dla i znacznie zmniejszyłem w modelu Lasso, to znaczy, że powinienem usunąć te zmienne z modelu?
EDIT3: Model z podwójnym wykładniczym wyprzedzeniem (Lasso) daje mi większe wartości dewiacji, BIC i DIC niż model z gaorskim priorem, a nawet otrzymuję mniejsze wartości po usunięciu współczynnika dyspersji w modelu Gaussa.