Przesunięcia czasu można zwykle postrzegać jako model szacujący częstość występowania zdarzenia na jednostkę czasu, z przesunięciem kontrolującym czas obserwacji różnych obiektów.
W modelach Poissona zawsze szacujesz tempo, że coś się dzieje, ale nigdy nie możesz zaobserwować tego tempa bezpośrednio. Państwo nie dostać obserwować liczbę razy, że zdarzenie na jakiś czas. Przesunięcie tworzy połączenie między tymi dwiema koncepcjami.
Na przykład obserwowałeś osoby strzelające do koszy przez różny czas i policzyłeś liczbę udanych koszy dla każdego obiektu. To, co naprawdę Cię interesuje, jak często każdy przedmiot tonie kosz, tj. Liczba udanych koszy, które każdy temat spodziewa się zatopić z każdą minutą, ponieważ jest to dość obiektywna miara ich umiejętności. Liczba koszy, które faktycznie zatopiłeś, byłaby wówczas szacunkową stawką razy, jak długo obserwowałeś próbę podmiotu. Możesz więc myśleć w kategoriach jednostek odpowiedzi, liczby koszy na minutę .
Trudno wyobrazić sobie sytuację, w której wykorzystałbyś czas obserwowany jako zmienną towarzyszącą w regresji poissona, ponieważ ze swojej natury szacujesz szybkość.
Na przykład, jeśli chcę ocenić wpływ bycia Amerykaninem vs Europejczykiem (bardzo głupiutki przykład) na liczbę koszyków, dodanie czasu jako współzmiennej pozwoliłoby mi ocenić ten efekt „niezależnie” od upływu czasu strzelania, prawda? to? Ponadto dałoby mi to oszacowanie wpływu czasu na wynik.
Oto przykład, który, mam nadzieję, podkreśla niebezpieczeństwo tego. Załóżmy, że Amerykanie i Europejczycy, tak naprawdę, zatapiają tę samą liczbę koszy co minutę. Ale powiedzmy, że obserwowaliśmy każdego Europejczyka dwa razy dłużej niż każdego Amerykanina, więc średnio zaobserwowaliśmy dwa razy więcej koszy dla każdego Europejczyka.
Jeśli skonfigurujemy model obejmujący parametry zarówno dla obserwowanego czasu, jak i wskaźnik „jest europejski”, wówczas oba te modele wyjaśniają dane:
E(baskets)=2ct+0xEropean
E(baskets)=0t+2cxEropean
c
Jako statystycy naprawdę chcemy, aby w tej sytuacji nasz model informował nas, że nie ma statystycznej różnicy między stopniem, w jakim Europejczycy robią koszyki, a tym, co Amerykanie robią koszyki. Ale nasz model tego nie zrobił i jesteśmy zdezorientowani.
Problem polega na tym, że wiemy coś, czego nasz model nie wie. Oznacza to, że wiemy, że jeśli będziemy obserwować tę samą osobę przez dwa razy więcej czasu, że w oczekiwaniu zrobią dwa razy więcej koszy. Ponieważ wiemy o tym, musimy powiedzieć o tym nasz model. To właśnie osiąga przesunięcie.
Być może zastosowanie metody offsetowej jest odpowiednie, gdy wiemy, że zdarzenia zdarzają się jednolicie w czasie!
Tak, ale jest to założenie samego modelu Poissona . Ze strony wikipedii w dystrybucji poissona
rozkład Poissona, nazwany na cześć francuskiego matematyka Siméona Denisa Poissona, jest dyskretnym rozkładem prawdopodobieństwa, który wyraża prawdopodobieństwo wystąpienia określonej liczby zdarzeń w ustalonym przedziale czasu i / lub przestrzeni, jeśli zdarzenia te występują ze znaną średnią częstotliwością i niezależnie od czas od ostatniego zdarzenia .