To stare pytanie, ale zaakceptowana odpowiedź nie jest w rzeczywistości poprawna ani kompletna. Użytkownik chce obliczyć odchylenie standardowe na podstawie danych z 12 miesięcy, przy czym średnia i odchylenie standardowe jest już obliczane dla każdego miesiąca. Zakładając, że liczba próbek w każdym miesiącu jest taka sama, możliwe jest obliczenie średniej próby i wariancji w ciągu roku na podstawie danych z każdego miesiąca. Dla uproszczenia załóżmy, że mamy dwa zestawy danych:
X={x1,....xN}
Y={y1,....,yN}
μxμyσ2xσ2y
Teraz chcemy obliczyć te same szacunki dla
Z={x1,....,xN,y1,...,yN}
μxσ2x
μx=∑Ni=1xiN
σ2x=∑Ni=1x2iN−μ2x
Aby oszacować średnią i wariancję dla całego zestawu, musimy obliczyć:
μz=∑Ni=1xi+∑Ni=1yi2N=(μx+μy)/2
σ2z=∑Ni=1x2i+∑Ni=1y2i2N−μ2z
σ2z=12(∑Ni=1x2iN−μ2x+∑Ni=1y2iN−μ2y)+12(μ2x+μ2y)−(μx+μy2)2
σ2z=12(σ2x+σ2y)+(μx−μy2)2
Więc jeśli masz wariancję dla każdego podzbioru i chcesz wariancję dla całego zestawu, możesz uśrednić wariancje każdego podzbioru, jeśli wszystkie mają tę samą średnią. W przeciwnym razie musisz dodać wariancję średniej każdego podzbioru.
Powiedzmy, że w pierwszej połowie roku produkujemy dokładnie 1000 MWh dziennie, aw drugiej połowie 2000 MWh dziennie. Następnie średnia i wariancja produkcji energii w pierwszej i drugiej połowie wynoszą 1000 i 2000 dla średniej, a wariancja wynosi 0 dla obu połówek. Teraz są dwie różne rzeczy, którymi możemy być zainteresowani:
1- Chcemy obliczyć wariancję produkcji energii w ciągu całego roku : następnie uśredniając dwie wariancje dochodzimy do zera, co nie jest poprawne, ponieważ energia na dzień w ciągu całego roku nie jest stała. W takim przypadku musimy dodać wariancję wszystkich średnich z każdego podzbioru. Matematycznie w tym przypadku losową zmienną będącą przedmiotem zainteresowania jest produkcja energii na dzień. Mamy przykładowe statystyki dotyczące podzbiorów i chcemy obliczać statystyki przykładowe w dłuższym czasie.
2- Chcemy obliczyć wariancję produkcji energii na rok: Innymi słowy, jesteśmy zainteresowani tym, jak bardzo produkcja energii zmienia się z roku na rok. W tym przypadku uśrednienie wariancji prowadzi do prawidłowej odpowiedzi, która wynosi 0, ponieważ każdego roku produkujemy średnio dokładnie 1500 MHW. Matematycznie w tym przypadku losowa zmienna procentowa jest średnią produkcji energii na dzień, przy czym uśrednianie odbywa się przez cały rok.