Czy mogę oszacować częstotliwość zdarzenia na podstawie losowych próbek jego wystąpienia?


9

Wprowadzono kilka zmian ...

To pytanie jest tylko dla zabawy, więc jeśli nie jest fajne, możesz je zignorować. Mam już dużo pomocy z tej strony, więc nie chcę gryźć ręki, która mnie karmi. Opiera się na przykładzie z prawdziwego życia i po prostu dużo się nad tym zastanawiałem.

Odwiedzam moje lokalne dojo, aby trenować w zasadzie losowo od poniedziałku do piątku. Załóżmy, że odwiedzam dwa razy w tygodniu. Oznacza to, że odwiedzam dokładnie dwa razy w tygodniu, z różnicą tylko dwóch dni. Jest jedna osoba, która prawie zawsze jest tam, gdziekolwiek jestem. Jeśli odwiedzi tego samego dnia co ja, wtedy go zobaczę. Załóżmy, że jest tam 90% czasu, kiedy tam jestem. Chcę wiedzieć dwie rzeczy:

1) jak często trenuje

2) czy przychodzi losowo, czy w określone dni tygodnia.

Zgaduję, że może musimy założyć, że jeden zgadnie drugi? Naprawdę nigdzie z tym nie ma. Po prostu myślę o tym podczas rozgrzewki co tydzień i znów jestem zaskoczony. Byłbym bardzo wdzięczny, nawet gdyby ktoś dał mi możliwość przemyślenia problemu.

Twoje zdrowie!


1
@Chris, cóż, musisz zacząć od zdefiniowania modelu. Kiedy mówisz, że odwiedzasz dwa razy w tygodniu losowo, może to oznaczać wiele rzeczy. Na przykład możesz iść co tydzień dokładnie dwa razy, wybrany jako losowa kombinacja dwóch elementów zestawu , lub możesz przejść średnio dwa razy tydzień, w którym, powiedzmy, rzucasz stronniczą monetą z prawdopodobieństwem głów wynoszącym 2/5 i idziesz codziennie, gdy widzisz głowę. To nie jedyne opcje. {Mon,,Fri}
kardynał

Czy zakładasz, że zawsze go zobaczysz, jeśli odwiedzisz dojo tego samego dnia co on? Jeśli nie, myślę, że powinniśmy wiedzieć coś o długości twoich sesji i długości jego sesji w porównaniu z długością każdego dnia, w którym dojo jest otwarte.
onestop

1
@Chris, @onestop, to pytanie przypomina mi i jest powiązane z techniką stosowaną do próbkowania ludzi, którzy mogą niechętnie odpowiadać na pytanie zgodnie z prawdą, często z powodu piętna społecznego, jakim jest udzielanie odpowiedzi twierdzącej. Wprowadzasz losowy element do próby, tak że z dość dużym prawdopodobieństwem respondent odpowiada twierdząco (bardziej zawstydzająca odpowiedź), nawet jeśli w rzeczywistości odpowiedziałby negatywnie. Jeśli prawdopodobieństwo losowo określonego „tak” jest wystarczająco wysokie, „stronniczość zawstydzenia” zostaje zmniejszona. Oczywiście trzeba też pobrać próbki od większej liczby osób.
kardynał

1
@Chris Musiałbyś przyjąć więcej założeń. Obecnie jest wiele ważnych wyjaśnień. Oto głupie: Czy wizyty danej osoby są niezależne od twoich? Jeśli nie, może odwiedza go tylko wtedy, gdy go odwiedzasz (codziennie szuka samochodu na zewnątrz), ale rzuca monetą (z prawdopodobieństwem 0,9) przed podjęciem decyzji o wejściu do środka.
vqv

1
Proste rozwiązanie: zapytaj go :-).
whuber

Odpowiedzi:


5

Twoje dane podadzą częściowe odpowiedzi za pomocą estymatorów Hansen-Hurwitz lub Horvitz-Thompson .

Model jest następujący: reprezentuje obecność tej osoby jako ciąg zmiennych wskaźnikowych (0/1) (qi), i=1,2,. Losowo obserwujesz podzbiór dwóch elementów z każdego tygodniowego bloku(q5k+1,q5k+2,,q5k+5). (Jest to forma systematycznego pobierania próbek.)

  1. Jak często trenuje ? Chcesz oszacować tygodniową średniąqi. Z zebranych statystyk wynika, że ​​średnia obserwacja wynosi 0,9. Załóżmy, że to zostało zebranewtygodnie Zatem estymator Horvitza-Thompsona całkowitej liczby wizyt danej osoby toqiπi = 52)qja = 52)(2)w)0,9 = 4.5w (gdzie πja jest szansa na obserwację qjaa suma jest nad twoimi rzeczywistymi obserwacjami.) To znaczy, powinieneś oszacować, że trenuje 4,5 dnia w tygodniu. Zobacz odniesienie, jak obliczyć standardowy błąd tego oszacowania. Jako bardzo dobre przybliżenie możesz użyć zwykłych (dwumianowych) wzorów.

  2. Czy trenuje losowo ? Nie ma sposobu, aby powiedzieć. Trzeba będzie utrzymywać sumy według dnia tygodnia.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.