Testowanie hipotezy Poissona dla dwóch parametrów

9

Tak więc, dla zabawy, pobieram niektóre dane połączeń z call center, w którym pracuję, i próbuję przetestować na nich kilka hipotez, a konkretnie liczbę połączeń odebranych w ciągu tygodnia, i dopasowuję je rozkładem Poissona. Ze względu na przedmiot mojej pracy istnieją dwa rodzaje tygodni, nazwijmy jeden z nich w tygodniach, w których przypuszczam, że jest więcej połączeń, a poza tygodniami, w których hipotetycznie jest ich mniej.

Mam teorię, że z tygodni (nazwijmy to ) jest większa niż z z tygodni (nazwijmy to ) $\lambda$ $\lambda_1$ $\lambda_2$

Tak więc hipoteza, którą chcę przetestować, to $H_0: \lambda_1 > \lambda_2, H_1: \lambda_1 \leq \lambda_2$

Wiem, jak testować jeden parametr (powiedzmy ), ale nie jestem pewien, jak zacząć robić 2, biorąc pod uwagę zestaw danych. Powiedzmy, że biorę dane z dwóch tygodni z każdego i dla tygodnia i i dla tygodnia. Czy ktoś może pomóc mi przejść przez tę prostszą wersję, tak że mogę zastosować ją do większego zestawu danych? Każda pomoc jest doceniana, dziękuję. $H_0: \lambda_1 > 1, H_1: \lambda_1 \leq 1$ $X_1 = 2$ $X_2 = 3$ $Y_1 = 2$ $Y_2=6$

hypothesis-testing poisson-distribution

— James Snyder
źródło

3

Czy połączenia są naprawdę rozdzielone poissonem? Jeśli jest wiele połączeń, najlepiej je modelować jako w przybliżeniu normalne. Ale to może zabić zabawę.

— Regress Forward

1

Co decyduje o tym, jak właściwie to oprawisz? Otrzymuję x liczby dyskretnych połączeń w jednostkowych ramach czasowych. Mógłbym to zrobić normalnie, ale z całą pewnością chciałbym spróbować z Poissonem, ponieważ pasuje.

— James Snyder

Jeśli założysz, że liczby są Poissonem, możesz po prostu dodać liczby (popraw mnie, jeśli się mylę). To znaczy, że dostaniesz X = 2 + 3, a Y = 2 + 6. Następnie możesz przetestować różnicę, używając na przykład „testu POISS.TEST” w R. Jeśli chcesz spróbować analizy bayesowskiej, mam również blog na ten temat tutaj: sumsar.net/blog/2014/ 09 / bayesian-first-aid-poisson-test

— Rasmus Bååth 17.04.15

4

Zauważ, że normalnie równość jest zerowa (z uzasadnionego powodu).

Pomijając tę kwestię, wspomnę o kilku podejściach do testu tego rodzaju hipotezy

Bardzo prosty test: warunek całkowitej obserwowanej liczby $n$ , który przekształca go w dwumianowy test proporcji. Wyobraź sobie, że są $w_\text{on}$ na tygodnie i $w_\text{off}$ poza tygodniami i $w$ tygodnie łącznie.

Następnie poniżej zera oczekiwane proporcje są $\frac{w_\text{on}}{w}$ i $\frac{w_\text{off}}{w}$ odpowiednio. Możesz dość łatwo wykonać jednostronny test proporcji w tygodniach.

Można skonstruować jednostronny test, dostosowując statystyki związane z testem współczynnika wiarygodności; Formularz Z testu Walda lub testu punktowego można wykonać na przykład jednostronnie i powinien on dobrze działać w przypadku dużych $\lambda$ .

Są inne podejścia.

— Glen_b - Przywróć Monikę
źródło

1

Co z właśnie zastosowanym GLM ze strukturą błędów Poissona i log-link? Ale idea dwumianu może być silniejsza.

— Ivan Kshnyasev
źródło

Obecnie jest to raczej komentarz niż odpowiedź. Czy miałeś to jako komentarz, pytanie do wyjaśnienia czy odpowiedź? Jeśli to drugie, czy możesz rozszerzyć go na więcej odpowiedzi? Możemy również przekształcić go w komentarz.

— Gung - Przywróć Monikę

1

Rozliczyłbym to za pomocą GLM Poissona lub Quasi-Poissona z preferencją dla quasi-Poissona lub dwumianu ujemnego.

Problem z użyciem tradycyjnego Poissona polega na tym, że wymaga on wariancji i średniej równości, co najprawdopodobniej nie jest prawdą. Quasi-Poisson lub NB szacuje wariancję nieograniczoną średnią.

Możesz wykonać dowolną z tych czynności w R. bardzo łatwo.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

Podejście GLM jest korzystne i można je rozszerzyć o dodatkowe zmienne (np. Miesiąc w roku), które mogą mieć wpływ na liczbę połączeń.

Aby to zrobić ręcznie, prawdopodobnie użyłbym normalnego przybliżenia i testu t dwóch próbek.

— iacobus
źródło

1

Zaczynamy od parametru Maximum Likelihood Estimate dla parametru Poissona, który jest wartością średnią.

Więc, $\hat\lambda_1=\bar Y~~and~~\hat\lambda_2=\bar X$

Teraz możesz po prostu przetestować $\bar Y-\bar X\sim N(\lambda_1-\lambda_2,\frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2})$

a następnie porównaj, otrzymując wartość Z = $\frac{(\bar Y-\bar X)-\lambda_1-\lambda_2}{\sqrt{\frac{\lambda_1}{n_1}+\frac{\lambda_2}{n_2}}}$

Uwaga: - kryterium odrzucenia jest $Z<Critical~Value$

— Hemant Rupani
źródło

0

Począwszy od strony 125 testowej hipotezy statystycznej Caselli nakreślono odpowiedź na rodzaj sformułowanego pytania. Załączam link do pliku pdf, który znalazłem w Internecie w celach informacyjnych. Testowanie statystycznej hipotezy Caselli, wydanie trzecie .

— Nuzhi Meyen
źródło

Fajny wskaźnik, jednak odradzane są tylko odpowiedzi typu link w Cross Validated. Czy potrafisz naszkicować rozdzielczość w swojej odpowiedzi? Dziękuję Ci.

— Xi'an

Przepraszamy, nie wiedziałem o tej zasadzie. Dzięki za poinformowanie mnie. :) Postaram się udzielić wyczerpującej odpowiedzi tak szybko, jak to możliwe.

— Nuzhi Meyen,