Mam zbiór danych na temat prób rolnych. Moja zmienna odpowiedzi to stosunek odpowiedzi: log (leczenie / kontrola). Interesuje mnie, co pośredniczy w różnicy, więc prowadzę meta-regresje RE (nieważone, ponieważ wydaje się całkiem jasne, że wielkość efektu nie jest skorelowana z wariancją szacunków).
Każde badanie podaje plon ziarna, plon biomasy lub jedno i drugie. Nie mogę przypisać plonu ziarna na podstawie badań, które podają same plony biomasy, ponieważ nie wszystkie badane rośliny były przydatne do ziarna (na przykład trzcina cukrowa). Ale każda roślina, która produkowała zboże, miała także biomasę.
W przypadku brakujących zmiennych towarzyszących stosowałem iteracyjną regresję (zgodnie z rozdziałem podręcznika Andrew Gelmana). Wydaje się, że daje rozsądne wyniki, a cały proces jest ogólnie intuicyjny. Zasadniczo przewiduję brakujące wartości i używam tych przewidywanych wartości do przewidywania brakujących wartości i przechodzę przez każdą zmienną, aż każda zmienna w przybliżeniu zbiegnie się (w rozkładzie).
Czy jest jakiś powód, dla którego nie mogę użyć tego samego procesu do przypisania brakujących wyników? Prawdopodobnie mogę stworzyć względnie informacyjny model imputacji dla współczynnika odpowiedzi biomasy, biorąc pod uwagę współczynnik odpowiedzi ziarna, rodzaj uprawy i inne zmienne towarzyszące, które posiadam. Następnie wyliczyłem współczynniki i VCV i dodałem korektę MI zgodnie ze standardową praktyką.
Ale co mierzą te współczynniki, gdy same wyniki są przypisywane? Czy interpretacja współczynników różni się od standardowego MI dla zmiennych towarzyszących? Myśląc o tym, nie mogę się przekonać, że to nie działa, ale nie jestem do końca pewien. Mile widziane są myśli i sugestie dotyczące lektury.