Dostałem dane do analizy w celu zbadania wpływu leczenia na poziomy żelaza w czterech różnych punktach czasowych (przed leczeniem, dzień zakończenia leczenia, 4 tygodnie po leczeniu i 2-4 miesiące po leczeniu). Nie ma grupy kontrolnej. Chcą sprawdzić, czy występuje znaczny wzrost poziomu żelaza w każdym z 3 punktów czasowych po leczeniu do poziomu przed leczeniem (poziom wyjściowy). Jedenaście pacjentów miało poziomy wyjściowe, ale tylko 8 pacjentów miało pełne dane dla wszystkich 4 punktów czasowych ( = 11, 10, 9 i 8 dla każdego punktu czasowego). Mierzono nie tylko poziomy żelaza, ale w każdym punkcie czasowym wykonywano dwa inne pomiary laboratoryjne w celu porównania z poziomem wyjściowym.
Mam kilka pytań, jak to przeanalizować. Najpierw pomyślałem, że RM ANOVA będzie odpowiednia do analizy tych danych, ale martwiłem się o małą wielkość próby, utratę danych i nienormalny rozkład danych. Następnie rozważyłem porównanie każdej miary po leczeniu z wartością wyjściową za pomocą testów rangowanych znaków Wilcoxona, ale potem wpadłem na problem wielu porównań. Przeczytałem jednak literaturę, że lekceważenie wymaga przeprowadzenia wielu porównań. Ogólnie rzecz biorąc, mam do czynienia z małymi rozmiarami próbek, niekompletnymi danymi i wieloma porównaniami (i czy jest to konieczne).
Mam nadzieję, że to wszystko miało sens. Jestem nowy w CrossValidated i zostałem tu skierowany przez kolegę jako miejsce do nauki od doświadczonych statystów, więc byłbym wdzięczny za wszelkie porady! Dzięki!
Edytowane w celu dodania surowych danych z komentarza:
Istnieją cztery całkowite punkty czasowe, a zmienna wynikowa jest ciągła. Na przykład wyniki w każdym punkcie czasowym wyglądają podobnie do tego:
Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]
1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
3rd Post (n=8): [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]