Testowanie hipotezy Poissona dla dwóch parametrów


9

Tak więc, dla zabawy, pobieram niektóre dane połączeń z call center, w którym pracuję, i próbuję przetestować na nich kilka hipotez, a konkretnie liczbę połączeń odebranych w ciągu tygodnia, i dopasowuję je rozkładem Poissona. Ze względu na przedmiot mojej pracy istnieją dwa rodzaje tygodni, nazwijmy jeden z nich w tygodniach, w których przypuszczam, że jest więcej połączeń, a poza tygodniami, w których hipotetycznie jest ich mniej.

Mam teorię, że z tygodni (nazwijmy to ) jest większa niż z z tygodni (nazwijmy to )λλ1λ2

Tak więc hipoteza, którą chcę przetestować, toH0:λ1>λ2,H1:λ1λ2

Wiem, jak testować jeden parametr (powiedzmy ), ale nie jestem pewien, jak zacząć robić 2, biorąc pod uwagę zestaw danych. Powiedzmy, że biorę dane z dwóch tygodni z każdego i dla tygodnia i i dla tygodnia. Czy ktoś może pomóc mi przejść przez tę prostszą wersję, tak że mogę zastosować ją do większego zestawu danych? Każda pomoc jest doceniana, dziękuję.H0:λ1>1,H1:λ11X1=2X2=3Y1=2Y2=6


3
Czy połączenia są naprawdę rozdzielone poissonem? Jeśli jest wiele połączeń, najlepiej je modelować jako w przybliżeniu normalne. Ale to może zabić zabawę.
Regress Forward

1
Co decyduje o tym, jak właściwie to oprawisz? Otrzymuję x liczby dyskretnych połączeń w jednostkowych ramach czasowych. Mógłbym to zrobić normalnie, ale z całą pewnością chciałbym spróbować z Poissonem, ponieważ pasuje.
James Snyder

Jeśli założysz, że liczby są Poissonem, możesz po prostu dodać liczby (popraw mnie, jeśli się mylę). To znaczy, że dostaniesz X = 2 + 3, a Y = 2 + 6. Następnie możesz przetestować różnicę, używając na przykład „testu POISS.TEST” w R. Jeśli chcesz spróbować analizy bayesowskiej, mam również blog na ten temat tutaj: sumsar.net/blog/2014/ 09 / bayesian-first-aid-poisson-test
Rasmus Bååth 17.04.15

Odpowiedzi:


4

Zauważ, że normalnie równość jest zerowa (z uzasadnionego powodu).

Pomijając tę ​​kwestię, wspomnę o kilku podejściach do testu tego rodzaju hipotezy

  1. Bardzo prosty test: warunek całkowitej obserwowanej liczby n, który przekształca go w dwumianowy test proporcji. Wyobraź sobie, że sąwna na tygodnie i wpoza poza tygodniami i w tygodnie łącznie.

Następnie poniżej zera oczekiwane proporcje są wnaw i wpozawodpowiednio. Możesz dość łatwo wykonać jednostronny test proporcji w tygodniach.

  1. Można skonstruować jednostronny test, dostosowując statystyki związane z testem współczynnika wiarygodności; Formularz Z testu Walda lub testu punktowego można wykonać na przykład jednostronnie i powinien on dobrze działać w przypadku dużychλ.

Są inne podejścia.


1

Co z właśnie zastosowanym GLM ze strukturą błędów Poissona i log-link? Ale idea dwumianu może być silniejsza.


Obecnie jest to raczej komentarz niż odpowiedź. Czy miałeś to jako komentarz, pytanie do wyjaśnienia czy odpowiedź? Jeśli to drugie, czy możesz rozszerzyć go na więcej odpowiedzi? Możemy również przekształcić go w komentarz.
Gung - Przywróć Monikę

1

Rozliczyłbym to za pomocą GLM Poissona lub Quasi-Poissona z preferencją dla quasi-Poissona lub dwumianu ujemnego.

Problem z użyciem tradycyjnego Poissona polega na tym, że wymaga on wariancji i średniej równości, co najprawdopodobniej nie jest prawdą. Quasi-Poisson lub NB szacuje wariancję nieograniczoną średnią.

Możesz wykonać dowolną z tych czynności w R. bardzo łatwo.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

Podejście GLM jest korzystne i można je rozszerzyć o dodatkowe zmienne (np. Miesiąc w roku), które mogą mieć wpływ na liczbę połączeń.

Aby to zrobić ręcznie, prawdopodobnie użyłbym normalnego przybliżenia i testu t dwóch próbek.


1

Zaczynamy od parametru Maximum Likelihood Estimate dla parametru Poissona, który jest wartością średnią.

Więc, λ^1=Y¯  zanre  λ^2)=X¯

Teraz możesz po prostu przetestować Y¯-X¯N.(λ1-λ2),λ1n1+λ2)n2))

a następnie porównaj, otrzymując wartość Z =(Y¯-X¯)-λ1-λ2)λ1n1+λ2)n2)

Uwaga: - kryterium odrzucenia jest Z<dorjatjadozal V.zalumi


0

Począwszy od strony 125 testowej hipotezy statystycznej Caselli nakreślono odpowiedź na rodzaj sformułowanego pytania. Załączam link do pliku pdf, który znalazłem w Internecie w celach informacyjnych. Testowanie statystycznej hipotezy Caselli, wydanie trzecie .


Fajny wskaźnik, jednak odradzane są tylko odpowiedzi typu link w Cross Validated. Czy potrafisz naszkicować rozdzielczość w swojej odpowiedzi? Dziękuję Ci.
Xi'an

Przepraszamy, nie wiedziałem o tej zasadzie. Dzięki za poinformowanie mnie. :) Postaram się udzielić wyczerpującej odpowiedzi tak szybko, jak to możliwe.
Nuzhi Meyen,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.