Repozytoria danych dotyczących zdrowia publicznego w Stanach Zjednoczonych zmierzają w kierunku AGE w formacie pięcioletnim, w związku z wpływem przepisów HIPAA dotyczących celowego zaślepiania i maskowania danych ze względu na prywatność.
Biorąc pod uwagę to wyzwanie w stosunku do tego, co było w przeszłości (przed HIPAA), na dość skalowalnym poziomie elementu danych miary w oparciu o różnicę między datą urodzenia a datą śmierci, może być konieczne ponowne rozważenie AGE jako zmiennej skalowej, która może być parametrycznie opisane w ogóle w zestawach danych zdrowia publicznego, na korzyść modeli opisujących AGE w sposób nieparametryczny, jako porządkowy poziom miary. Wiem, że może się to wydawać „przesadne” dla wielu frakcji w społeczności informatycznej biomedycyny, ale ten pomysł może mieć pewne zalety pod względem „interpretacji”, jak opisano w komentarzach powyżej.
A co z całą siłą analityczną dostępną dla podejść nieparametrycznych? Tak, to prawda, że każdy z nas prawie uniwersalnie spróbuje zastosować techniki GLM (ogólny model liniowy) do zmiennej, która przedstawia się nam w rozkładach, które zachowują się tak, jak AGE.
Jednocześnie należy wziąć pod uwagę kształt tego rozkładu i sposób, w jaki kształt ten jest określany przez oddziaływanie wielowymiarowe oddziaływań na wielowymiarowe centroidy i centroidy podgrupy obecne w rozkładzie. Co zrobić z tymi bardzo złożonymi zestawami danych?
Gdy element danych nie spełnia „założeń modelu”, stopniowo skanujemy (powiedziałem w poprzek, a nie w dół; powinniśmy być pracodawcami metody równych szans, każde narzędzie pochodzi z fabryki w formie zgodnej z regułami funkcji) lista innych możliwych modeli, aby znaleźć te, które „nie zawiodą” testów założeń.
W obecnym formacie zestawów danych dotyczących zdrowia publicznego naprawdę potrzebujemy (jako społeczności wizualizacji danych), aby opracować bardziej standardowy model obsługi AGE w odstępach pięcioletnich (5YI). Mój głos za wizualizacją danych AGE (biorąc pod uwagę nowy format 5YI) to użycie histogramów oraz wykresów pudełkowych i wąsów. Tak, oznacza to medianę. (Gra słów nie przeznaczona!)
Czasami obraz jest naprawdę wart tysiąca słów, a streszczenie to streszczenie tysiąca słów. Wykres pudełka i wąsów pokazuje „kształt” rozkładu jako znaczącą symboliczną reprezentację histogramu na niemal kultowym poziomie rozdzielczości. Porównanie rozkładów pięcioletnich przyrostów wieku poprzez pokazanie wykresów „bok obok siebie” i wykresów wąsów, w których można natychmiast wizualnie porównać wzorce od 75 do 50 (mediana) do niższych 25 nilitów, stanowiłby elegancki „uniwersalny standard” do porównywania wieku świat. Dla tych z nas, którzy nadal cieszą się dreszczem reprezentacji danych za pomocą mechaniki tekstowej wyświetlania tabelarycznego, diagram „łodyga i liść” może być również przydatny, gdy zostanie zastosowany jako animowany element grafiki wizualnej w „wykresie przebiegu w czasie”
WIEK osiągnął pełnoletność. Należy go dalej badać za pomocą bardziej wydajnych algorytmów obliczeniowych, które są już dostępne.