Ściągawka ANOVA Alfabet Zupa i odpowiedniki regresji

Czy mogę uzyskać pomoc w ukończeniu tej wstępnej (w toku) próby uzyskania orientacji na równoważnikach ANOVA i REGRESSION? Próbowałem pogodzić pojęcia, nazewnictwo i składnię tych dwóch metod. Na tej stronie znajduje się wiele postów na temat ich podobieństwa, na przykład to czy tamto , ale nadal dobrze jest mieć szybką mapę „jesteś tutaj” na początku.

Planuję zaktualizować ten post i mam nadzieję uzyskać pomoc w poprawianiu błędów.

ANOVA w jedną stronę:

Structure:   DV is continuous; IV is ONE FACTOR with different LEVELS.
Scenario:    miles-per-gal. vs cylinders
             Note that Income vs Gender (M, F) is a t-test.
Syntax:      fit <- aov(mpg ~ as.factor(cyl), data = mtcars); summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl), mtcars) 
             # with F dummy coded;
             summary(fit); anova(fit)

Dwukierunkowa ANOVA:

Structure:   DV is continuous; IV is > 1 FACTORS with different LEVELS.
Scenario:    mpg ~ cylinders & carburators
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

Dwukierunkowa czynnikowa ANOVA:

Structure:   All possible COMBINATIONS of LEVELS are considered.
Scenario:    mpg ~ cylinders + carburetors + (4cyl/1,...8cyl/4)
Syntax:      fit <- aov(mpg ~ as.factor(cyl) * as.factor(carb), mtcars); 
             summary(fit); TukeyHSD(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) * as.factor(carb), mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

ANCOVA:

Structure:   DV continuous ~ Factor and continuous COVARIATE.
Scenario:    mpg ~ cylinders + weight
Syntax:      fit <- aov(mpg ~ as.factor(cyl) + wt, mtcars); summary(fit)
Regression:  fit <- lm(mpg ~ as.factor(cyl) + wt, mtcars) 
             # with F dummy coded; 
             summary(fit); anova(fit)

MANOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR ("One-way") or 2 FACTORS ("Two-way MANOVA").
Scenario:    mpg and wt ~ cylinders
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl), mtcars); summary(fit)
Regression:  N/A

MANCOVA:

Structure:   > 1 DVs continuous ~ 1 FACTOR + 1 continuous (covariate) DV.
Scenario:    mpg and wt ~ cyl + displacement (cubic inches)
Syntax:      fit <- manova(cbind(mpg,wt) ~ as.factor(cyl) + disp, mtcars); summary(fit)
Regression:  N/A

BEZ WSPÓŁCZYNNIKA (lub PRZEDMIOTU) ANOVA: ( kod tutaj )

Structure:   DV continuous ~ FACTOR with each level * with subject (repeated observations).
             Extension paired t-test. Each subject measured at each level multiple times. 
Scenario:    Memory rate ~ Emotional value of words for Subjects @ Times
Syntax:      fit <- aov(Recall_Rate ~ Emtl_Value * Time + Error(Subject/Time), data); 
             summary(fit); print(model.tables(fit, "means"), digits=3);
             boxplot(Recall_Rate ~ Emtl_Value, data=data)
             with(data, interaction.plot(Time, Emtl_Value, Recall_Rate))
             with(data, interaction.plot(Subject, Emtl_Value, Recall_Rate))
             NOTE: Data should be in the LONG FORMAT (same subject in multiple rows)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Recall_Rate ~ Emtl_Value * Time + (1|Subject/Time), data); 
             anova(fit); summary(fit); coefficients(fit); confint(fit) 
or
             require(nlme)
             fit <- lme(Recall_Rate ~ Emtl_Value * Time, random = ~1|Subject/Time, data)
             summary(fit); anova(fit); coefficients(fit); confint(fit)

SPLIT-PLOT: ( kod tutaj )

Structure:   DV continuous ~ FACTOR/-S with RANDOM EFFECTS and pseudoreplication.
Scenario:    Harvest yield ~ Factors = Irrigation / Density of seeds / Fertilizer 
                 & RANDOM EFFECTS (Blocks and plots of land): 
Syntax:      fit <- aov(yield ~ irrigation * density * fertilizer + 
                 Error(block/irrigation/density), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest); 
             fit <- lmer(yield ~ irrigation * fertilizer + 
             (1|block/irrigation/density), data = splityield); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             library(nlme)
             fit <- lme(yield ~ irrigation * variety, random=~1|field, irrigation)
             summary(fit); anova(fit)

NESTED DESIGN: ( kod tutaj )

Structure:   DV continuous ~ FACTOR/-S with pseudoreplication.
Scenario:    [Glycogen] ~ Factors = Treatment & RANDOM EFFECTS with Russian-doll effect: 
             Six rats (6 Livers)-> 3 Microscopic Slides/Liver-> 2 Readings/Slide). 
Syntax:      fit <- aov(Glycogen ~ Treatment + Error(Rat/Liver), data); summary(fit)
Regression:  Mixed Effects
             require(lme4); require(lmerTest)
             fit <- lmer(Glycogen ~ Treatment + (1|Rat/Liver), rats); 
             anova(fit); summary(fit); coefficients(fit); confint(fit)
or
             require(nlme)
             fit<-lme(Glycogen ~ Treatment, random=~1|Rat/Liver, rats)
             summary(fit); anova(fit); VarCorr(fit)

PRZYDATNE STRONY:

regression anova mixed-model

— Antoni Parellada
źródło

Jedna uwaga: dla twoich dwukierunkowych przykładów ANOVA (prosto i silniczkowo) twoim scenariuszem / składnią jest cyl + hp. Horespower jest ciągły, więc tutaj nie działa. carb, liczba gaźników byłaby lepszym wyborem.

— Gregor

Dziękuję Ci! Nieostrożny błąd. Dzięki twojej notatce wykryłem również cyl traktowany jako ciągły, więc zmieniłem go na as.factor. I włączyłem TukeyHSD.

— Antoni Parellada,

Myślę, że powinieneś porzucić „Survival” z tytułu, ponieważ jest to bardzo specyficzny obszar statystyk całkowicie niezwiązany z tym, co (bardzo ładnie) podsumowujesz.

— Bryan Hanson

Ładne podsumowanie Antoni! Być może mógłbyś także dodać glmmFAQ Ben Bolkera i może kilka prostych przykładów dwumianowych i Poissona (GLM i GLMM). Rozumiem jednak, że może to zbytnio skomplikować sytuację i zabiera to miłe i zwięzłe streszczenie. Alternatywnie możesz link do przykładów na tej stronie. Dla kompletnego prostego dwumianowego przykładu Poissona / ujemnego może to działać: stats.stackexchange.com/questions/325334/...

— Stefan

Ładna lista, Antoni. Oto kilka drobnych sugestii:

ANOVA jednokierunkowa: IV to CZYNNIK z 3 lub więcej poziomami. Możesz także dodać przykładowe dane: mtcars do tego wpisu. (Podobnie, możesz dodać instrukcje * Przykładowe dane) do wszystkich swoich wpisów, aby wyjaśnić, jakich zestawów danych używasz.)

Dwukierunkowa Anova: dlaczego nie użyć IV1 i IV2 i stwierdzić, że dwie niezależne zmienne powinny być czynnikami o co najmniej dwóch poziomach? Sposób, w jaki to stwierdziłeś, obecnie sugeruje, że dwukierunkowa anova może zawierać więcej niż 2 niezależne zmienne (lub czynniki), co nie jest sensowne.

W przypadku dwukierunkowej Anova rozróżniam te dwa podtypy: 1. Dwukierunkowa Anova z głównymi efektami dla IV1 i IV2 oraz 2. Dwukierunkowa Anova z interakcją między IV1 i IV2. Ten drugi punkt jest tym, co nazywacie dwoma jako czynnikową dwukierunkową anovą.) Lepszym sposobem opisania tych dwóch podgrup jest: 1. Wpływ IV1 na DV jest niezależny od wpływu IV2 i 2. Wpływ IV1 na DV zależy od IV2. Można również wyjaśnić, że to zmienne niezależne IV1 i IV2 są obojętne w ustawieniach regresji.

W przypadku ANCOVA możesz wyjaśnić, że w obecnym przykładzie rozważasz tylko jednokierunkową ANCOVA. Dla kompletności można dodać dwukierunkowy przykład ANCOVA bez interakcji między IV1 i IV2 oraz jeden z interakcją między tymi dwiema zmiennymi.

W związku z powyższym można również dodać element o nazwie Cel , który opisuje, kiedy analizy są przydatne. Na przykład:

Cel (jednokierunkowej anova): Zbadaj, czy średnie wartości DV są różne na poziomach IV.

Czy w przypadku MANOVA możesz wyjaśnić, że potrzebowałbyś (a) dwóch lub więcej DV i (2) jednej lub więcej IV, które są czynnikami? Sądzę, że możesz rozróżnić jednokierunkową MANOVA (z 1 czynnikiem) i dwukierunkową MANOVA? To samo dotyczy MANCOVA.

ANOVA WEWNĄTRZ FAKTORA jest również znana jako ANOVA POWTARZAJĄCYCH SIĘ, więc być może możesz dodać tę terminologię do listy dla tych, którzy ją znają. Pomocne byłoby również wyjaśnienie, że modelowanie efektów mieszanych stanowi alternatywny sposób modelowania danych z powtarzanych pomiarów. W przeciwnym razie czytelnicy mogą nie docenić różnicy między tymi dwoma podejściami.

— Isabella Ghement
źródło

Łatwiej jest mi przedstawiać sugestie niż wprowadzać zmiany. ”

— Isabella Ghement