Mam zestaw danych z N ~ 5000 i brakuje mi około 1/2 co najmniej jednej ważnej zmiennej. Główną metodą analityczną będą proporcjonalne zagrożenia Coxa.
Planuję zastosować wielokrotne przypisanie. Podzielę się również na pociąg i zestaw testowy.
Czy należy podzielić dane, a następnie przypisać osobno, czy przypisać, a następnie podzielić?
Jeżeli ma to znaczenie, będę używał PROC MI
w SAS
.