Mam klasyczny model liniowy z 5 możliwymi regresorami. Nie są ze sobą skorelowane i mają dość niską korelację z odpowiedzią. Doszedłem do modelu, w którym 3 regresory mają znaczące współczynniki dla ich statystyki t (p <0,05). Dodanie jednej lub obu pozostałych 2 zmiennych daje wartości p> 0,05 dla statystyki t, dla dodanych zmiennych. To prowadzi mnie do przekonania, że model 3 zmiennych jest „najlepszy”.
Jednak używając komendy anova (a, b) w R, gdzie a jest modelem 3 zmiennych, a b jest modelem pełnym, wartość p dla statystyki F wynosi <0,05, co mówi mi, że wolę model pełny od zmiennej 3 Model. Jak pogodzić te pozorne sprzeczności?
Dzięki PS Edytuj: Dalsze informacje. To praca domowa, więc nie będę publikować szczegółów, ale nie podajemy szczegółów tego, co reprezentują regresory - są one ponumerowane od 1 do 5. Jesteśmy proszeni o „wyprowadzenie odpowiedniego modelu, podając uzasadnienie”.