Czy istnieje gałąź statystyki, która zajmuje się danymi, dla których dokładne wartości nie są znane , ale dla każdej osoby znamy maksymalne lub minimalne ograniczenie do wartości ?
Podejrzewam, że mój problem wynika w dużej mierze z tego, że staram się go wyrazić statystycznie, ale mam nadzieję, że przykład pomoże wyjaśnić:
Powiedzmy, że istnieją dwie połączone populacje i tak że w pewnym momencie członkowie mogą „przejść” do , ale odwrotność nie jest możliwa. Czas przejścia jest zmienny, ale nieprzypadkowy. Na przykład może oznaczać „osobniki bez potomstwa”, a „osobniki z co najmniej jednym potomstwem”. Interesuje mnie wiek, w którym ten postęp występuje, ale mam tylko dane przekrojowe. Dla danego indywidualny, mogę dowiedzieć się, czy należą one do lub . Znam także wiek tych osób. Dla każdej osoby w populacjiB A B A B A B A, Wiem, że wiek w chwili przejścia będzie WIĘKSZY NIŻ ich obecny wiek. Podobnie, w przypadku członków grupy wiem, że wiek przejścia był MNIEJSZY NIŻ ich obecny wiek. Ale nie znam dokładnych wartości.
Powiedzmy, że mam inny czynnik, który chcę porównać z wiekiem przejścia. Na przykład chcę wiedzieć, czy podgatunek lub wielkość ciała danej osoby wpływa na wiek pierwszego potomstwa. Zdecydowanie mam kilka przydatnych informacji, które powinny udzielić odpowiedzi na te pytania: średnio u osób w osoby starsze przechodzą później. Ale informacje są niedoskonałe , szczególnie dla młodszych osób. I vice versa dla populacji .
Czy istnieją ustalone metody radzenia sobie z tego rodzaju danymi ? Niekoniecznie potrzebuję pełnej metody przeprowadzania takiej analizy, tylko kilka wyszukiwanych haseł lub użytecznych zasobów, aby zacząć na właściwym miejscu!
Ostrzeżenia: Przyjmuję uproszczone założenie, że przejście z punktu do punktu jest natychmiastowe. Jestem również gotów założyć, że większość osób przejdzie w pewnym momencie do , zakładając, że żyją wystarczająco długo. I zdaję sobie sprawę, że dane podłużne byłyby bardzo pomocne, ale zakładam, że w tym przypadku nie są one dostępne.B B
Przepraszam, jeśli jest to duplikat, jak powiedziałem, częścią mojego problemu jest to, że nie wiem, czego powinienem szukać. Z tego samego powodu w razie potrzeby dodaj inne tagi.
Zbiór danych próbki: Ssp oznacza jedną z dwóch podgatunków, lub . Potomstwo oznacza brak potomstwa ( ) lub co najmniej jedno potomstwo ( )Y A B
age ssp offsp
21 Y A
20 Y B
26 X B
33 X B
33 X A
24 X B
34 Y B
22 Y B
10 Y B
20 Y A
44 X B
18 Y A
11 Y B
27 X A
31 X B
14 Y B
41 X B
15 Y A
33 X B
24 X B
11 Y A
28 X A
22 X B
16 Y A
16 Y B
24 Y B
20 Y B
18 X B
21 Y B
16 Y B
24 Y A
39 X B
13 Y A
10 Y B
18 Y A
16 Y A
21 X A
26 X B
11 Y A
40 X B
8 Y A
41 X B
29 X B
53 X B
34 X B
34 X B
15 Y A
40 X B
30 X A
40 X B
Edycja: przykładowy zestaw danych został zmieniony, ponieważ nie był zbyt reprezentatywny