Analiza linii czasu


10

Prowadzę badania związku między kolejnością narodzin danej osoby a późniejszym ryzykiem otyłości, wykorzystując dane z kilku rocznych kohort porodowych (np. Http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).

Kluczowym wyzwaniem jest to, że kolejność urodzeń jest powiązana z innymi cechami, takimi jak wiek matki, liczba młodszych i / lub starszych rodzeństw oraz odstępy urodzeniowe, które mogą również wpływać na wynik za pomocą różnych mechanizmów. Ponadto, jakikolwiek wpływ tych rzeczy na późniejsze ryzyko otyłości może zostać zmodyfikowany przez skład płciowy rodzeństwa, w tym „dziecko indeksowe” (uczestnik kohorty porodowej).

Dla każdego indeksu dziecko można narysować oś czasu pokazującą wszystkie porody w rodzinie, z wiekiem matki w zmiennej czasowej.

wprowadź opis zdjęcia tutaj

Próbuję zidentyfikować metody analizy tego rodzaju danych, w których kolejność, czas i charakter zdarzeń mogą mieć znaczenie. Zadaję to pytanie ze względu na różnorodność aplikacji, z którymi współpracują członkowie - spodziewam się, że ktoś będzie miał natychmiastowe sugestie, których identyfikacja zajmie mi więcej czasu. Będziemy wdzięczni za wszelkie akty we właściwym kierunku (kierunkach).

Powiązane pytania: w jaki sposób powinienem analizować dane dotyczące przedziałów urodzeniowych kobiet?


1
+1. Zwykłe pytanie: czy masz dane dotyczące BMI rodziców?
Deer Hunter

Tak, istnieją pewne podłużne dane antropometryczne dla matek dzieci indeksu. Niestety nie u rodzeństwa, co wyklucza jakiekolwiek analizy w obrębie rodziny między analizami rodzinnymi.
DL Dahly,

W tej chwili niewiele pomocnych przemyśleń na temat osi czasu. Możesz chcieć, aby wiek macierzyński przy pierwszym porodzie był inną niezależną zmienną; Zakładam, że dokonałeś już analizy eksploracyjnej i wizualizacji ...
Deer Hunter

Oczywiście należy uwzględnić wiek matki, dlatego powyższe ramy czasowe wykorzystują wiek matki jako zmienną czasową. Myślę, że mam nadzieję znaleźć alternatywną metodę, która oferuje coś więcej niż tylko wrzucenie wszystkiego do modelu liniowego.
DL Dahly,

Nie jestem pewien, czy to ma znaczenie, ale sądzę, że waga urodzeniowa lub średnia waga urodzeniowa dzieci kobiety może być interesującą zmienną towarzyszącą. Czy możesz również podać więcej informacji na temat swojego wyniku? Czy powtórzyłeś kroki?
ReliableResearch

Odpowiedzi:


2

Możesz rozważyć zastosowanie modeli wielopoziomowych (regresja mieszana) do oszacowania efektów rodzinnych i pomiędzy nimi. Jedną z możliwych strategii jest zastosowanie zaplanowanego podejścia do budowania modelu hierarchicznego. Na przykład przetestuj każdy potencjalny predyktor w modelu jednoczynnikowym. Jeśli efekty między rodzinami usuwają efekt kolejności narodzin, to zdecydowanie sugeruje, że kolejność narodzin nie jest ważna, ale że inne czynniki są. Przykład przytoczenia tego efektu kolejności urodzeń na IQ:

Mam nadzieję, że to pomocne.


+1 za dobry pomysł, z którym się spotkałem, ale nie mam żadnych danych dotyczących rodzeństwa dla tej konkretnej analizy.
DL Dahly

0

Podchodzę do tego jako pytania statystycznego i nie mam specjalnej wiedzy na temat zagadnień medycznych.

Patrząc na artykuł, do którego się odwołujesz, widzę, że jedna kohorta zawierała 970 osób. Jeśli masz dane o kilku kohortach mniej więcej tego rozmiaru, wówczas ogólny rozmiar zestawu danych oferuje możliwość wyboru stosunkowo dużych podzbiorów, w których oś czasu każdej osoby spełnia określone warunki. Na przykład, podzbiór może obejmować, powiedzmy, wszystkie osoby płci męskiej w wieku 25-29 lat. Regresja dla takiego podzbioru odpowiedniej miary późniejszej otyłości względem kolejności urodzenia wyeliminowałaby jakikolwiek możliwy wpływ na późniejszą otyłość różnic płciowych dziecka indeksowanego i w dużym stopniu wyeliminowałaby ewentualny wpływ wieku matczynego.

Rozszerzenie tego podejścia na płeć rodzeństwa nie jest proste, ponieważ jeśli jednym z warunków dla podzbioru byłoby, powiedzmy, że dziecko indeksowe ma starsze rodzeństwo żeńskie, oznacza to, że dziecko indeksowe nie jest najstarszym dzieckiem, zawężając zakres zmiennej niezależnej w regresji. Jednak rozwiązaniem może być zdefiniowanie warunków za pomocą „jeśli w ogóle”. Na przykład można zdefiniować podzbiór obejmujący wszystkie osobniki płci męskiej w wieku 25–29 lat oraz ze starszym rodzeństwem, jeśli w ogóle, wszystkie kobiety. Taki podzbiór nadal obejmowałby osoby o dowolnym porządku urodzenia.

Gdyby podzbiór był zdefiniowany przez zbyt złożony zestaw warunków, wówczas liczba osobników w nim zawartych mogłaby być tak mała, że ​​uzyskane oszacowania współczynników byłyby zbyt nieprecyzyjne, aby były użyteczne. Gdyby przyjąć to podejście, prawdopodobnie trzeba byłoby dokonać kompromisu przy definiowaniu podzbiorów, między wyeliminowaniem jak największej liczby możliwych efektów a włączeniem wystarczającej liczby osób, aby uzyskać użyteczny wynik.


Dziękuję za odpowiedź Adam. W tym przypadku jednak nie sądzę, że rozwarstwienie próbki powie ci coś poza podobnie skorygowanym modelem. Możliwe, że właściwie określony model liniowy jest najlepszym sposobem na zrobienie tego ... Miałem tylko nadzieję, że statystycy z innych dziedzin poradzą sobie z podobnymi problemami na różne sposoby.
DL Dahly,

Zgadzam się - jeśli tak mówisz - że moje podejście jest równoważne pojedynczej regresji dla całego zestawu danych przy użyciu wielu zmiennych wskaźnikowych. Biorąc za przykład wiek matki, potencjalnym problemem każdego modelu, który traktuje go jako zmienną ciągłą, jest to, że wymaga założenia formy funkcjonalnej (związek między wiekiem matki a późniejszą otyłością może być krzywoliniowy). Natomiast model wykorzystujący zestaw zmiennych wskaźnikowych dla przedziałów wiekowych matki nie wymaga takiego założenia i pod tym względem jest bardziej ogólny.
Adam Bailey,

0

Sugerowałbym analizę danych funkcjonalnych, ale podejrzewam, że możesz mieć dużo rodzin z zbyt małą liczbą dzieci, aby uzyskać rozsądne szacunki. Śmiało i czytaj jednak, ponieważ odpowiada on Twoim potrzebom. Być może ktoś już go używał z podobnymi danymi.

Jeśli nie chcesz robić czegoś tak masowo nieparametrycznego, powinieneś wykorzystać swoją wiedzę kliniczną, aby zmniejszyć wymiarowość danych. Na przykład jedna zmienna w twoim modelu może być liczbą dzieci, inna może być średnią liczbą lat między dziećmi i tak dalej. Jeśli w tych zmiennych występuje jakikolwiek efekt, może się pojawić, nawet jeśli od razu nie określiłeś poprawnie formy funkcjonalnej. Dalsze budowanie modeli opartych na wiedzy może pozwolić na zbudowanie modelu wysoce przewidywalnego - po prostu upewnij się, że zachowałeś zestaw sprawdzania poprawności!


Korzystam z FDA i nie jestem pewien, jak to ma zastosowanie. Mógłbym ustawić oś x = 0 dla każdego potomka indeksu, a inne rodzeństwo narysować w czasie +/- na tej osi; i mieć wiek macierzyński jako oś y; a następnie oszacuj monotoniczny funkcjonalny obiekt danych dla każdego dziecka indeksu ... ale gdy to zrobiłem, straciłem wszystkie informacje o faktycznej liczbie rodzeństwa i miejscu, w którym wypadają wzdłuż linii (ponieważ wszystko jest teraz podsumowane przez funkcja). FDA obejmuje wiele trybów analizy - czy miałeś na myśli coś bardziej szczegółowego?
DL Dahly,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.