Jestem nowy w statystyce i staram się zrozumieć różnicę między ANOVA a regresją liniową. Używam R. do zbadania tego. Czytałem różne artykuły o tym, dlaczego ANOVA i regresja są różne, ale wciąż takie same, i jak można to wizualizować itp. Myślę, że jestem tam dość, ale wciąż brakuje jednego bitu.
Rozumiem, że ANOVA porównuje wariancję w obrębie grup z wariancją między grupami, aby ustalić, czy istnieje jakakolwiek różnica między którąkolwiek z badanych grup. ( https://controls.engin.umich.edu/wiki/index.php/Factor_analysis_and_ANOVA )
W przypadku regresji liniowej znalazłem post na tym forum, który mówi, że to samo można przetestować, gdy sprawdzimy, czy b (nachylenie) = 0. ( Dlaczego naucza się / stosuje ANOVA, jakby to była inna metodologia badawcza niż regresja liniowa? )
Dla więcej niż dwóch grup znalazłem stronę internetową z informacją:
Hipoteza zerowa to:
Model regresji liniowej to:
Wynikiem regresji liniowej jest jednak przecięcie dla jednej grupy i różnica w stosunku do tego przecięcia dla pozostałych dwóch grup. ( http://www.real-statistics.com/multiple-regression/anova-using-regression/ )
Dla mnie wygląda to tak, że przecięcia są porównywane, a nie nachylenia?
Kolejny przykład, w którym porównują przechwytywanie zamiast nachyleń, można znaleźć tutaj: ( http://www.theanalysisfactor.com/why-anova-and-linear-regression-are-the-same-analysis/ )
Próbuję teraz zrozumieć, co faktycznie porównuje się z regresją liniową? stoki, przecięcia czy oba?