Mam zestaw danych, który zawiera ~ 7500 badań krwi od ~ 2500 osób. Próbuję dowiedzieć się, czy zmienność wyników badań krwi wzrasta, czy maleje wraz z upływem czasu między dwoma badaniami. Na przykład - pobieram twoją krew do testu podstawowego, a następnie natychmiast pobieram drugą próbkę. Sześć miesięcy później rysuję kolejną próbkę. Można oczekiwać, że różnica między testem początkowym a natychmiastowym powtórzeniem testu będzie mniejsza niż różnica między testem początkowym a testem sześciomiesięcznym.
Każdy punkt na wykresie poniżej odzwierciedla różnicę między dwoma testami. X oznacza liczbę dni między dwoma testami; Y jest wielkością różnicy między dwoma testami. Jak widać, testy nie są równomiernie rozmieszczone wzdłuż X - badanie nie zostało zaprojektowane, aby odpowiedzieć na to pytanie, naprawdę. Ponieważ punkty są tak mocno ułożone w środku, zawarłem 95% (niebieskie) i 99% (czerwone) linie kwantylowe, oparte na 28-dniowych oknach. Są one oczywiście przyciągane przez bardziej ekstremalne punkty, ale masz pomysł.
alt text http://a.imageshack.us/img175/6595/diffsbydays.png
Wydaje mi się, że zmienność jest dość stabilna. Jeśli już, to jest wyższy, gdy test powtarza się w krótkim czasie - to jest strasznie sprzeczne z intuicją. Jak mogę rozwiązać ten problem w sposób systematyczny, uwzględniając różne wartości n w każdym punkcie czasowym (i niektóre okresy bez testów w ogóle)? Twoje pomysły są bardzo mile widziane.
Dla porównania, jest to rozkład liczby dni między testem a ponownym testem:
alt text http://a.imageshack.us/img697/6572/testsateachtimepoint.png