Używasz średniej długości i średniej masy do obliczenia średniego BMI?


13

Czy prawidłowe jest zastosowanie średniej długości ( ) i średniej masy ( )) z danej populacji do obliczenia średniego wskaźnika ( ) dla tej populacji?hwBMI=wh2


Pytanie nie jest takie abstrakcyjne (według komentarza @ JoeTaxpayera): typowe rzeczywiste BMI (15.0-30.0) już i tak będą zaokrąglane do 1dp, więc jeśli błąd w średnim BMI z powodu zastosowania stosunku średnich wynosi ~ 0,05 -0,1 jest matematycznie nieistotny (<1%); dla większości rzeczywistych rozkładów (wzrost, waga). Nie mówimy o Laurel i Hardy ...
smci

Odpowiedzi:


18

Matematycznie nie jest tak, że są one koniecznie blisko. Działałoby, gdyby ale ogólnie jest to fałsz, aw niektórych szczególnych sytuacjach może być dość daleko.E(Y/X2)=E(Y)/E(X)2

Jednak w przypadku dość realistycznego zestawu dwuwymiarowych danych dotyczących wzrostu i masy wygląda na to, że wpływ będzie niewielki.

Weźmy na przykład model wzrostu i masy ciała dorosłego mężczyzny w USA w Brainard i Burmaster (1992) [1]; ten model jest dwuwymiarową normalną pod względem wzrostu i logarytmu (masy), która całkiem dobrze pasuje do danych dotyczących wzrostu i masy i ułatwia uzyskanie realistycznych symulacji. Dobry model dla kobiet jest nieco bardziej skomplikowany, ale nie sądzę, że miałoby to tak duży wpływ na jakość aproksymacji BMI; Zamierzam zrobić samce, ponieważ bardzo prosty model jest całkiem dobry.

Przekształcając tam model męskiego wzrostu i masy ciała na metryczny i symulując 100 000 punktów dwuwymiarowych w R przed obliczeniem poszczególnych BMI, a tym samym średniego BMI, a także obliczeniem średniego wzrostu przy (średniej masie), okazuje się, że wynik był taki, że BMI wynosił (do czterech cyfr) 25,21, a wynosił 25,22, co wygląda dość blisko.h¯/w¯2

Patrząc na efekt różnicowania parametrów, wygląda na to, że wpływ zastosowania uprzedzonego estymatora średnich zmiennych dla kobiet byłby prawdopodobnie nieco większy, ale wciąż niewystarczający, aby prawdopodobnie stanowił duży problem.

Idealnie powinno być sprawdzone coś bliższego jakiejkolwiek sytuacji, w której chcesz go użyć, ale prawdopodobnie będzie całkiem niezłe.

W typowej sytuacji wydaje się, że w praktyce nie będzie to stanowić większego problemu.

[1]: Brainard, J. and Burmaster, DE (1992),
„ Dwuwymiarowe rozkłady wzrostu i masy ciała mężczyzn i kobiet w Stanach Zjednoczonych”,
Risk Analysis , vol. 12, nr 2, str. 267–275


10

Nie jest to całkowicie poprawne, ale zwykle nie robi dużej różnicy.

Załóżmy na przykład, że twoja populacja ma masy 80, 90 i 100 kg i ma 1,7, 1,8 i 1,9 m wysokości. Zatem BMI to 27,68, 27,78 i 27,70. Średnia BMI wynosi 27,72. Jeśli obliczasz BMI na podstawie średnich wag i wysokości, otrzymujesz 27,78, co jest nieco inne, ale zwykle nie powinno robić dużej różnicy.


Wielkie dzięki za odpowiedź! Oznacza to, że ta metoda obliczeń prawdopodobnie nie byłaby odpowiednia dla jakiegokolwiek rodzaju analizy statystycznej, prawda?
Sophie Michel,

2
Szczerze mówiąc, nie posunąłbym się tak daleko. Statystyki i tak zajmują się hałaśliwymi danymi, a niewielka niedokładność pomiaru wysokości lub ciężarów zmniejszyłaby różnicę, którą tutaj mamy. Radzę zasymulować coś zgodnie z tymi danymi z danymi, których zamierzasz użyć, a następnie zastanów się, czy te niewielkie różnice naprawdę będą miały wpływ na twoją analizę statystyczną.
Stephan Kolassa

1
„Jeśli obliczysz BMI na podstawie średnich wag i wysokości, otrzymasz 27,78” Ale to równa się maksymalnej BMI! Uzyskanie maksimum zamiast średniej wydaje mi się dużą różnicą.
Kumulacja

@Acccumulation - Punkt Stephana był martwy, ale wybór liczb nie ilustrował dobrze sytuacji. BMI dla „normalnej” wynosi od 18,5 do 24,9. 3 BMI w tym przykładzie mają niski do wysokiego zakresu .1. Różnica 1/2% w tych danych to szum. BMI mężczyzny 5'8 "rośnie z 27,4 do 27,5, gdy jego waga wzrasta ze 180 do 181. 1lb to różnica między wypiciem wysokiej szklanki wody przed lub po wejściu na wagę.
JTP - Przeproś Monikę

@JoeTaxpayer: Myślę, że twoim celem jest to, że typowe BMI (15.0-30.0) i tak będą już zaokrąglane do 1dp, więc jeśli błąd w średnim BMI z powodu zastosowania współczynnika średnich wynosi <0,05, jest to matematycznie nieistotne. Poprawny?
smci

3

Chociaż zgadzam się z innymi odpowiedziami, że jest prawdopodobne, że ta metoda przybliży średni BMI, chciałbym zauważyć, że jest to tylko przybliżenie.

Jestem skłonny powiedzieć, że nie powinieneś używać opisywanej metody, ponieważ jest ona po prostu mniej dokładna. Obliczanie BMI dla każdej osoby jest trywialne, a następnie obliczanie średniej z tego, co daje rzeczywisty średni BMI.

Zilustruję tutaj dwie skrajności, w których średnie masy i długości pozostają takie same, ale średnie BMI jest w rzeczywistości różne:

Za pomocą następującego kodu (Matlab):

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.5, 1.5, 1.5, 1.8, 1.8, 1.8;]; % OUR DATA
length = length.^2;
bmi = weight./length;
scatter(1:size(weight,2), bmi, 'filled');
yline(mean(bmi),'red','LineWidth',2);
yline(mean(weight)/mean(length),'blue','LineWidth',2);
xlabel('Person');
ylabel('BMI');
legend('BMI', 'mean(bmi)', 'mean(weight)/mean(length)', 'Location','northwest');

Otrzymujemy: mean_bmi2

Jeśli po prostu ponownie zamówimy długości, otrzymamy inną średnią wartość BMI, podczas gdy średnia (waga) / średnia (długość ^ 2) pozostaje taka sama:

weight = [60, 61, 62, 100, 101, 102]; % OUR DATA
length = [1.8, 1.8, 1.8, 1.5, 1.5, 1.5;]; % OUR DATA (REORDERED)
... % rest is the same

znaczy bmi

Ponownie, używając rzeczywistych danych, prawdopodobnie Twoja metoda będzie zbliżona do rzeczywistego średniego BMI, ale dlaczego miałbyś zastosować mniej dokładną metodę?

Poza zakresem pytania: zawsze dobrym pomysłem jest wizualizacja danych, aby można było faktycznie zobaczyć rozkłady. Jeśli zauważysz na przykład niektóre klastry, możesz również rozważyć oddzielne środki dla tych klastrów (np. Osobno dla pierwszych 3 i ostatnich 3 osób w moim przykładzie)


2
„Obliczenie BMI dla każdej osoby jest trywialne, a następnie wzięcie jej pod uwagę, co daje prawdziwy średni BMI”. Tak, jeśli masz nieprzetworzone dane. Jeśli masz tylko statystyki podsumowujące populację, takie jak średni wzrost i wagę, to najlepiej z nich uzyskać „BMI populacji”, a także pytanie, jak złe jest prawidłowe przybliżenie.
Stephan Kolassa

1
+1 Nie agreguj agregatów, jeśli możesz uzyskać ten sam rodzaj odpowiedzi, agregując surowe dane. Istnieją odpowiedzi i komentarze, które w tym przypadku mają niewielki / brak / szczupły / nieistotny wpływ, ale nie rób tego. Dowiedz się i stosuj zdrowe praktyki dotyczące analizy danych, rób to we właściwy sposób.
Stian Yttervik
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.