Statystyki i duże zbiory danych modeling

11

Czy jest jakiś powód, aby preferować AIC lub BIC nad drugim?

AIC i BIC są metodami oceny dopasowania modelu karanymi za liczbę oszacowanych parametrów. Jak rozumiem, BIC karze modele bardziej za wolne parametry niż AIC. Czy poza preferencjami opartymi na rygorystycznych kryteriach istnieją jeszcze inne powody, by preferować AIC zamiast BIC lub odwrotnie?

222 modeling aic cross-validation bic model-selection

3

Jak się dowiedzieć, że problem uczenia maszynowego jest beznadziejny?

Wyobraź sobie standardowy scenariusz uczenia maszynowego: Masz do czynienia z dużym, wielowymiarowym zestawem danych i rozumiesz go dość niewyraźnie. To, co musisz zrobić, to przewidzieć jakąś zmienną na podstawie tego, co masz. Jak zwykle czyścisz dane, przeglądasz statystyki opisowe, uruchamiasz niektóre modele, weryfikujesz je krzyżowo itp., Ale po kilku próbach, …

207 machine-learning forecasting modeling model-selection forecastability

17

Uwzględniając interakcję, ale nie główne efekty w modelu

Czy kiedykolwiek jest uzasadnione włączenie dwukierunkowej interakcji do modelu bez uwzględnienia głównych efektów? Co jeśli twoja hipoteza dotyczy tylko interakcji, czy nadal musisz uwzględnić główne efekty?

85 regression modeling interaction regression-coefficients

24

Praktyczne zasady dla „nowoczesnych” statystyk

Lubię książkę G van Belle'a na temat statystycznych reguł kciuka oraz, w mniejszym stopniu, typowych błędów w statystyce (i jak ich uniknąć) autorstwa Phillipa I Gooda i Jamesa W. Hardina. Odnoszą się do typowych problemów podczas interpretacji wyników badań eksperymentalnych i obserwacyjnych oraz dostarczają praktycznych zaleceń dotyczących wnioskowania statystycznego lub …

85 modeling eda rule-of-thumb

7

Jaka jest korzyść z rozbicia ciągłej zmiennej predykcyjnej?

Zastanawiam się, jaka jest wartość biorąc ciągłą zmienną predykcyjną i dzieląc ją (np. Na kwintyle) przed użyciem jej w modelu. Wydaje mi się, że binowanie zmiennej powoduje utratę informacji. Czy to tylko po to, abyśmy mogli modelować efekty nieliniowe? Gdybyśmy utrzymywali zmienną ciągłą i nie byłaby to tak naprawdę prosta …

78 regression modeling continuous-data binning regression-strategies

14

Co oznacza „Wszystkie modele są złe, ale niektóre są przydatne”

„Zasadniczo wszystkie modele są błędne, ale niektóre są przydatne”. --- Box, George EP; Norman R. Draper (1987). Empiryczne budowanie modeli i powierzchnie reakcji, str. 424, Wiley. ISBN 0471810339. Jakie jest dokładnie znaczenie powyższej frazy?

76 modeling

6

Model do przewidywania liczby wyświetleń Youtube stylu Gangnam

Teledysk PSY „Gangnam style” jest popularny, po nieco ponad 2 miesiącach ma około 540 milionów widzów. Nauczyłem się tego od moich czternastu dzieci podczas obiadu w zeszłym tygodniu i wkrótce dyskusja poszła w kierunku, czy można było przewidzieć, ilu widzów będzie za 10-12 dni i kiedy (/ jeśli) piosenka przejdzie …

73 modeling web

5

Wykorzystanie k-krotnej walidacji krzyżowej do wyboru modelu szeregów czasowych

Pytanie: Chcę się czegoś upewnić, czy stosowanie k-krotnej walidacji krzyżowej z szeregami czasowymi jest proste, czy też należy na to zwrócić szczególną uwagę? Tło: modeluję 6-letni szereg czasowy (z łańcuchem pół-markowa), z próbką danych co 5 minut. Aby porównać kilka modeli, używam 6-krotnej walidacji krzyżowej, dzieląc dane na 6 lat, …

70 time-series modeling cross-validation

7

Czy wszystkie warunki interakcji wymagają indywidualnych warunków w modelu regresji?

Właśnie recenzuję manuskrypt, w którym autorzy porównują modele regresji logit 5-6 z AIC. Jednak niektóre modele mają warunki interakcji bez uwzględnienia poszczególnych warunków zmiennych towarzyszących. Czy ma to kiedykolwiek sens? Na przykład (nie dotyczy modeli rejestrujących): M1: Y = X1 + X2 + X1*X2 M2: Y = X1 + X2 …

68 regression modeling interaction aic

11

Dlaczego powinienem być Bayesianinem, gdy mój model jest zły?

Edycje: Dodałem prosty przykład: wnioskowanie o średniej XiXjaX_i . Wyjaśniłem też nieco, dlaczego wiarygodne przedziały niepasujące do przedziałów ufności są złe. Ja, dość pobożny Bayesjan, jestem w trakcie pewnego rodzaju kryzysu wiary. Mój problem jest następujący. Załóżmy, że chcę przeanalizować niektóre dane IID XiXjaX_i . Chciałbym: najpierw zaproponuj model warunkowy: …

68 bayesian modeling philosophical misspecification

6

Zmienny wybór do modelowania predykcyjnego naprawdę potrzebny w 2016 roku?

To pytanie zostało zadane w CV kilka lat temu, wydaje się, że warto je przesłać w świetle 1) lepszej technologii obliczeniowej rzędu wielkości (np. Obliczenia równoległe, HPC itp.) I 2) nowszych technik, np. [3]. Po pierwsze, jakiś kontekst. Załóżmy, że celem nie jest testowanie hipotez, nie szacowanie efektów, ale przewidywanie …

67 machine-learning modeling feature-selection model-selection prediction

4

Dlaczego uwzględnianie szerokości i długości geograficznej na koncie GAM w celu autokorelacji przestrzennej?

Stworzyłem uogólnione modele dodatków do wylesiania. Aby uwzględnić autokorelację przestrzenną, uwzględniłem szerokość i długość geograficzną jako wygładzony termin interakcji (tj. S (x, y)). Oparłem to na przeczytaniu wielu artykułów, w których autorzy mówią: „aby uwzględnić przestrzenną autokorelację, współrzędne punktów zostały uwzględnione jako wygładzone terminy”, ale nigdy nie wyjaśniły, dlaczego tak …

60 r modeling spatial autocorrelation gam

6

Co to jest „nasycony” model?

Co należy rozumieć, gdy mówimy, że mamy model nasycony?

58 modeling regression

3

Zmienne są często korygowane (np. Standaryzowane) przed wykonaniem modelu - kiedy jest to dobry pomysł, a kiedy zły?

W jakich okolicznościach chciałbyś skalować lub standaryzować zmienną przed dopasowaniem modelu? A jakie są zalety / wady skalowania zmiennej?

56 modeling predictive-models feature-selection theory standardization

3

Co jest takiego fajnego w twierdzeniu o reprezentacji de Finetti?

Z teorii statystyki Mark J. Schervish (strona 12): Chociaż twierdzenie DeFinetti o reprezentacji 1.49 ma zasadnicze znaczenie dla motywowania modeli parametrycznych, w rzeczywistości nie jest wykorzystywane w ich implementacji. W jaki sposób twierdzenie jest kluczowe dla modeli parametrycznych?

55 probability modeling mathematical-statistics parametric

Pytania otagowane jako modeling