Załóżmy, że mam jedną próbkę częstotliwości 4 możliwych zdarzeń:
Event1 - 5
E2 - 1
E3 - 0
E4 - 12
i mam spodziewane prawdopodobieństwo wystąpienia moich zdarzeń:
p1 - 0.2
p2 - 0.1
p3 - 0.1
p4 - 0.6
Dzięki sumie obserwowanych częstotliwości moich czterech zdarzeń (18) mogę obliczyć oczekiwane częstotliwości zdarzeń, prawda?
expectedE1 - 18 * 0.2 = 3.6
expectedE2 - 18 * 0.1 = 1.8
expectedE1 - 18 * 0.1 = 1.8
expectedE1 - 18 * 0.6 = 10.8
Jak mogę porównać zaobserwowane wartości z wartościami oczekiwanymi? sprawdzić, czy moje obliczone prawdopodobieństwa są dobrymi predyktorami?
Myślałem o teście chi-kwadrat, ale wynik zmienia się wraz z rozmiarem próbki (n = 18), to znaczy, jeśli pomnożę obserwowane wartości przez 1342 i użyję tej samej metody, wynik będzie inny. Może test sparowany z Wilcoxem działa, ale co sugerujesz?
Jeśli można zasugerować w R, byłoby lepiej.