Podsumowując , im więcej dowiaduję się o statystykach, tym mniej ufam opublikowanym artykułom w mojej dziedzinie; Po prostu uważam, że naukowcy nie robią wystarczająco dobrych statystyk.
Jestem laikiem, że tak powiem. Mam wykształcenie biologiczne, ale nie mam formalnego wykształcenia w dziedzinie statystyki lub matematyki. Lubię R i często staram się czytać (i rozumieć ...) niektóre teoretyczne podstawy metod, które stosuję podczas badań. Nie zdziwiłoby mnie to, gdyby większość osób przeprowadzających analizy dzisiaj nie była formalnie przeszkolona. Opublikowałem około 20 oryginalnych prac, z których niektóre zostały zaakceptowane przez uznane czasopisma, a statystycy często brali udział w procesie przeglądu. Moje analizy często obejmują analizę przeżycia, regresję liniową, regresję logistyczną, modele mieszane. Nigdy wcześniej recenzent nie pytał o założenia modelu, dopasowanie lub ocenę.
Dlatego tak naprawdę nigdy nie przejmowałem się zbytnio założeniami, dopasowaniem i oceną modelu. Zaczynam od hipotezy, przeprowadzam regresję, a następnie prezentuję wyniki. W niektórych przypadkach starałem się ocenić te rzeczy, ale zawsze kończyło się to „ dobrze, że nie spełniało ono wszystkich założeń, ale ufam wynikom („ wiedza merytoryczna ”) i są one wiarygodne, więc jest w porządku ” i podczas konsultacji ze statystykami zawsze wydawali się zgadzać.
Rozmawiałem teraz z innymi statystykami i statystykami (chemikami, lekarzami i biologami), którzy sami przeprowadzają analizy; wydaje się, że ludzie tak naprawdę nie przejmują się zbytnio tymi wszystkimi założeniami i formalnymi ocenami. Ale tutaj w CV jest mnóstwo ludzi pytających o wartości resztkowe, dopasowanie modelu, sposoby oceny, wartości własne, wektory i lista jest długa. Powiem to w ten sposób, kiedy lme4 ostrzega przed dużymi wartościami własnymi, naprawdę wątpię, aby wielu jego użytkowników chciało rozwiązać ten problem ...
Czy to warte dodatkowego wysiłku? Czy nie jest prawdopodobne, że większość wszystkich opublikowanych wyników nie przestrzega tych założeń i być może nawet ich nie oceniła? Jest to prawdopodobnie rosnący problem, ponieważ bazy danych rosną z każdym dniem i istnieje przekonanie, że im większe dane, tym mniej ważne są założenia i oceny.
Mogę się całkowicie mylić, ale tak to postrzegałem.
Aktualizacja: Cytat zapożyczony ze StasK (poniżej): http://www.nature.com/news/science-joins-push-to-screen-statistics-in-papers-1.15050