AIC i BIC są metodami oceny dopasowania modelu karanymi za liczbę oszacowanych parametrów. Jak rozumiem, BIC karze modele bardziej za wolne parametry niż AIC. Czy poza preferencjami opartymi na rygorystycznych kryteriach istnieją jeszcze inne powody, by preferować AIC zamiast BIC lub odwrotnie?
Wyobraź sobie standardowy scenariusz uczenia maszynowego: Masz do czynienia z dużym, wielowymiarowym zestawem danych i rozumiesz go dość niewyraźnie. To, co musisz zrobić, to przewidzieć jakąś zmienną na podstawie tego, co masz. Jak zwykle czyścisz dane, przeglądasz statystyki opisowe, uruchamiasz niektóre modele, weryfikujesz je krzyżowo itp., Ale po kilku próbach, …
Czy kiedykolwiek jest uzasadnione włączenie dwukierunkowej interakcji do modelu bez uwzględnienia głównych efektów? Co jeśli twoja hipoteza dotyczy tylko interakcji, czy nadal musisz uwzględnić główne efekty?
Lubię książkę G van Belle'a na temat statystycznych reguł kciuka oraz, w mniejszym stopniu, typowych błędów w statystyce (i jak ich uniknąć) autorstwa Phillipa I Gooda i Jamesa W. Hardina. Odnoszą się do typowych problemów podczas interpretacji wyników badań eksperymentalnych i obserwacyjnych oraz dostarczają praktycznych zaleceń dotyczących wnioskowania statystycznego lub …
Zastanawiam się, jaka jest wartość biorąc ciągłą zmienną predykcyjną i dzieląc ją (np. Na kwintyle) przed użyciem jej w modelu. Wydaje mi się, że binowanie zmiennej powoduje utratę informacji. Czy to tylko po to, abyśmy mogli modelować efekty nieliniowe? Gdybyśmy utrzymywali zmienną ciągłą i nie byłaby to tak naprawdę prosta …
„Zasadniczo wszystkie modele są błędne, ale niektóre są przydatne”. --- Box, George EP; Norman R. Draper (1987). Empiryczne budowanie modeli i powierzchnie reakcji, str. 424, Wiley. ISBN 0471810339. Jakie jest dokładnie znaczenie powyższej frazy?
Teledysk PSY „Gangnam style” jest popularny, po nieco ponad 2 miesiącach ma około 540 milionów widzów. Nauczyłem się tego od moich czternastu dzieci podczas obiadu w zeszłym tygodniu i wkrótce dyskusja poszła w kierunku, czy można było przewidzieć, ilu widzów będzie za 10-12 dni i kiedy (/ jeśli) piosenka przejdzie …
Pytanie: Chcę się czegoś upewnić, czy stosowanie k-krotnej walidacji krzyżowej z szeregami czasowymi jest proste, czy też należy na to zwrócić szczególną uwagę? Tło: modeluję 6-letni szereg czasowy (z łańcuchem pół-markowa), z próbką danych co 5 minut. Aby porównać kilka modeli, używam 6-krotnej walidacji krzyżowej, dzieląc dane na 6 lat, …
Właśnie recenzuję manuskrypt, w którym autorzy porównują modele regresji logit 5-6 z AIC. Jednak niektóre modele mają warunki interakcji bez uwzględnienia poszczególnych warunków zmiennych towarzyszących. Czy ma to kiedykolwiek sens? Na przykład (nie dotyczy modeli rejestrujących): M1: Y = X1 + X2 + X1*X2 M2: Y = X1 + X2 …
Edycje: Dodałem prosty przykład: wnioskowanie o średniej XiXjaX_i . Wyjaśniłem też nieco, dlaczego wiarygodne przedziały niepasujące do przedziałów ufności są złe. Ja, dość pobożny Bayesjan, jestem w trakcie pewnego rodzaju kryzysu wiary. Mój problem jest następujący. Załóżmy, że chcę przeanalizować niektóre dane IID XiXjaX_i . Chciałbym: najpierw zaproponuj model warunkowy: …
To pytanie zostało zadane w CV kilka lat temu, wydaje się, że warto je przesłać w świetle 1) lepszej technologii obliczeniowej rzędu wielkości (np. Obliczenia równoległe, HPC itp.) I 2) nowszych technik, np. [3]. Po pierwsze, jakiś kontekst. Załóżmy, że celem nie jest testowanie hipotez, nie szacowanie efektów, ale przewidywanie …
Stworzyłem uogólnione modele dodatków do wylesiania. Aby uwzględnić autokorelację przestrzenną, uwzględniłem szerokość i długość geograficzną jako wygładzony termin interakcji (tj. S (x, y)). Oparłem to na przeczytaniu wielu artykułów, w których autorzy mówią: „aby uwzględnić przestrzenną autokorelację, współrzędne punktów zostały uwzględnione jako wygładzone terminy”, ale nigdy nie wyjaśniły, dlaczego tak …
Z teorii statystyki Mark J. Schervish (strona 12): Chociaż twierdzenie DeFinetti o reprezentacji 1.49 ma zasadnicze znaczenie dla motywowania modeli parametrycznych, w rzeczywistości nie jest wykorzystywane w ich implementacji. W jaki sposób twierdzenie jest kluczowe dla modeli parametrycznych?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.