Tak, należy spodziewać się, że oba przykłady (nieważone vs. ważone) dadzą te same wyniki.
Zaimplementowałem dwa algorytmy z artykułu z Wikipedii.
Ten działa:
Jeżeli wszystkie xi pochodzą z tego samego rozmieszczenia i ciężarach całkowitych wi pokazuje częstotliwości występowania w próbce, wówczas nieobciążonym estymatorem ważonej wariancja populacyjna jest dana przez:
s2 =1V1−1∑Ni=1wi(xi−μ∗)2,
Jednak ten (przy użyciu wag ułamkowych) nie działa dla mnie:
xi1/wi
s2) = V.1V.2)1- V2)∑N.i = 1wja( xja- μ∗)2)
Nadal badam przyczyny, dla których drugie równanie nie działa zgodnie z przeznaczeniem.
/ EDYCJA: Znalazłem powód, dla którego drugie równanie nie działało tak, jak myślałem: możesz użyć drugiego równania tylko wtedy, gdy masz znormalizowane wagi lub wariancje („niezawodność”) i NIE jest to obiektywne, ponieważ jeśli nie używaj wag „powtarzających się” (licząc, ile razy obserwacja była obserwowana i dlatego powinna być powtarzana w operacjach matematycznych), tracisz zdolność do zliczania całkowitej liczby obserwacji, a zatem nie możesz użyć współczynnika korekcji.
To wyjaśnia różnicę w wynikach za pomocą wariancji ważonej i nieważonej: obliczenia są tendencyjne.
Dlatego jeśli chcesz mieć obiektywną wariancję ważoną, użyj tylko „powtarzalnych” wag i użyj pierwszego równania, które opublikowałem powyżej. Jeśli to nie jest możliwe, cóż, nie możesz na to poradzić.
Zaktualizowałem również artykuł w Wikipedii, jeśli chcesz uzyskać więcej informacji:
http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
I powiązany artykuł na temat obiektywnej kowariancji ważonej (która w rzeczywistości jest tą samą wariancją ze względu na tożsamość polaryzacji ):
Poprawne równanie dla ważonej obiektywnej kowariancji próbnej