Konieczne jest swobodne wnioskowanie. Jak rozwiązać ten podstawowy problem, nie można cofnąć się w czasie i nie dać komuś leczenia. Przeczytaj artykuły o Rubinie, Fisherze, założycielu współczesnego studenta statystyki.) .... Czego nauczyć się, aby rozwiązać ten problem, prawidłową randomizację i jak Prawo wielkich liczb mówi, że rzeczy są odpowiednio randomizowane, Testowanie hipotez, Potencjalne wyniki (wbrew założeniom hetroscastisty i świetnie radzi sobie z brakowaniem), dopasowywanie (świetne dla braków, ale potencjalne wyniki są lepsze, ponieważ są bardziej uogólnione, to znaczy, dlaczego uczyć się mnóstwa skomplikowanych rzeczy, skoro można nauczyć się tylko jednej skomplikowanej rzeczy), Bootstrap, oczywiście statystyki bayesowskie (regresja bayesowska , naiwna regresja bayesowska, czynniki bayesowskie) i alternatywy niepapetryczne.
Zwykle w praktyce wystarczy wykonać te ogólne kroki,
Jeśli chodzi o poprzedni komentarz, najpierw należy zacząć od ANOVA (efekty losowe lub efekty stałe i przekształcić ciągłe typy w kosze), a następnie zastosować regresję (która, jeśli przekształcisz i zmienisz, może być czasami tak dobra jak ANOVA, ale nigdy jej nie pobijesz) aby sprawdzić, które konkretne terapie są znaczące (przy zastosowaniu wielokrotnego testu t i zastosowania pewnej korekty, takiej jak metid Holma), użyj regresji.
W przypadkach, w których musisz przewidzieć, użyj regresji bayasowskiej.
Braki w ponad 5% wykorzystują potencjalne wyniki
Kolejną gałęzią analizy danych jest nadzorowane uczenie maszynowe, o którym należy wspomnieć