Mam nadzieję, że ktoś pomoże mi rozwiązać problem zamieszania. Powiedzmy, że chcę przetestować, czy 2 zestawy współczynników regresji różnią się znacznie od siebie, z następującą konfiguracją:
- , z 5 niezależnymi zmiennymi.
- 2 grupy o mniej więcej równych rozmiarach (choć może się to różnić)
- Tysiące podobnych regresji zostaną wykonane jednocześnie, więc należy wykonać pewną korektę wielu hipotez.
Jednym z zaproponowanych mi podejść jest zastosowanie testu Z:
Inną, którą widziałem na tej tablicy, jest wprowadzenie zmiennej zastępczej do grupowania i przepisanie modelu jako:
, gdzie g jest zmienną grupującą, kodowaną jako 0, 1.
Moje pytanie brzmi: w jaki sposób te dwa podejścia są różne (np. Różne założenia, elastyczność)? Czy jedno jest bardziej odpowiednie od drugiego? Podejrzewam, że jest to dość podstawowe, ale wszelkie wyjaśnienia byłyby bardzo mile widziane.