Czy prawidłowe jest zastosowanie średniej długości ( ) i średniej masy ( )) z danej populacji do obliczenia średniego wskaźnika ( ) dla tej populacji?
Czy prawidłowe jest zastosowanie średniej długości ( ) i średniej masy ( )) z danej populacji do obliczenia średniego wskaźnika ( ) dla tej populacji?
Odpowiedzi:
Matematycznie nie jest tak, że są one koniecznie blisko. Działałoby, gdyby ale ogólnie jest to fałsz, aw niektórych szczególnych sytuacjach może być dość daleko.
Jednak w przypadku dość realistycznego zestawu dwuwymiarowych danych dotyczących wzrostu i masy wygląda na to, że wpływ będzie niewielki.
Weźmy na przykład model wzrostu i masy ciała dorosłego mężczyzny w USA w Brainard i Burmaster (1992) [1]; ten model jest dwuwymiarową normalną pod względem wzrostu i logarytmu (masy), która całkiem dobrze pasuje do danych dotyczących wzrostu i masy i ułatwia uzyskanie realistycznych symulacji. Dobry model dla kobiet jest nieco bardziej skomplikowany, ale nie sądzę, że miałoby to tak duży wpływ na jakość aproksymacji BMI; Zamierzam zrobić samce, ponieważ bardzo prosty model jest całkiem dobry.
Przekształcając tam model męskiego wzrostu i masy ciała na metryczny i symulując 100 000 punktów dwuwymiarowych w R przed obliczeniem poszczególnych BMI, a tym samym średniego BMI, a także obliczeniem średniego wzrostu przy (średniej masie), okazuje się, że wynik był taki, że BMI wynosił (do czterech cyfr) 25,21, a wynosił 25,22, co wygląda dość blisko.
Patrząc na efekt różnicowania parametrów, wygląda na to, że wpływ zastosowania uprzedzonego estymatora średnich zmiennych dla kobiet byłby prawdopodobnie nieco większy, ale wciąż niewystarczający, aby prawdopodobnie stanowił duży problem.
Idealnie powinno być sprawdzone coś bliższego jakiejkolwiek sytuacji, w której chcesz go użyć, ale prawdopodobnie będzie całkiem niezłe.
W typowej sytuacji wydaje się, że w praktyce nie będzie to stanowić większego problemu.
[1]: Brainard, J. and Burmaster, DE (1992),
„ Dwuwymiarowe rozkłady wzrostu i masy ciała mężczyzn i kobiet w Stanach Zjednoczonych”,
Risk Analysis , vol. 12, nr 2, str. 267–275
Nie jest to całkowicie poprawne, ale zwykle nie robi dużej różnicy.
Załóżmy na przykład, że twoja populacja ma masy 80, 90 i 100 kg i ma 1,7, 1,8 i 1,9 m wysokości. Zatem BMI to 27,68, 27,78 i 27,70. Średnia BMI wynosi 27,72. Jeśli obliczasz BMI na podstawie średnich wag i wysokości, otrzymujesz 27,78, co jest nieco inne, ale zwykle nie powinno robić dużej różnicy.
Chociaż zgadzam się z innymi odpowiedziami, że jest prawdopodobne, że ta metoda przybliży średni BMI, chciałbym zauważyć, że jest to tylko przybliżenie.
Jestem skłonny powiedzieć, że nie powinieneś używać opisywanej metody, ponieważ jest ona po prostu mniej dokładna. Obliczanie BMI dla każdej osoby jest trywialne, a następnie obliczanie średniej z tego, co daje rzeczywisty średni BMI.
Zilustruję tutaj dwie skrajności, w których średnie masy i długości pozostają takie same, ale średnie BMI jest w rzeczywistości różne:
Za pomocą następującego kodu (Matlab):
weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.5, 1.5, 1.5, 1.8, 1.8, 1.8;]; % OUR DATA
length = length.^2;
bmi = weight./length;
scatter(1:size(weight,2), bmi, 'filled');
yline(mean(bmi),'red','LineWidth',2);
yline(mean(weight)/mean(length),'blue','LineWidth',2);
xlabel('Person');
ylabel('BMI');
legend('BMI', 'mean(bmi)', 'mean(weight)/mean(length)', 'Location','northwest');
Jeśli po prostu ponownie zamówimy długości, otrzymamy inną średnią wartość BMI, podczas gdy średnia (waga) / średnia (długość ^ 2) pozostaje taka sama:
weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.8, 1.8, 1.8, 1.5, 1.5, 1.5;]; % OUR DATA (REORDERED)
... % rest is the same
Ponownie, używając rzeczywistych danych, prawdopodobnie Twoja metoda będzie zbliżona do rzeczywistego średniego BMI, ale dlaczego miałbyś zastosować mniej dokładną metodę?
Poza zakresem pytania: zawsze dobrym pomysłem jest wizualizacja danych, aby można było faktycznie zobaczyć rozkłady. Jeśli zauważysz na przykład niektóre klastry, możesz również rozważyć oddzielne środki dla tych klastrów (np. Osobno dla pierwszych 3 i ostatnich 3 osób w moim przykładzie)