Pewnego dnia miałem konsultację z epidemiologiem. Jest doktorem medycyny ze stopniem zdrowia publicznego w dziedzinie epidemiologii i ma dużą wiedzę statystyczną. Doradza swoim pracownikom badawczym i rezydentom oraz pomaga im w kwestiach statystycznych. Całkiem dobrze rozumie testowanie hipotez. Miała typowy problem z porównaniem dwóch grup, aby sprawdzić, czy istnieje różnica w ryzyku związanym z wystąpieniem zastoinowej niewydolności serca (CHF). Zbadała średnią różnicę w odsetku pacjentów otrzymujących CHF. Wartość p wynosiła 0,08. Następnie postanowiła spojrzeć na ryzyko względne i uzyskała wartość p wynoszącą 0,027. Zapytała więc, dlaczego jedno jest ważne, a drugie nie. Patrząc na 95% dwustronne przedziały ufności dla różnicy i dla stosunku, zauważyła, że średni przedział różnicy zawierał 0, ale górny limit ufności dla tego współczynnika był mniejszy niż 1. Dlaczego więc otrzymujemy niespójne wyniki. Moja odpowiedź, choć technicznie poprawna, nie była zbyt satysfakcjonująca. Powiedziałem: „Są to różne statystyki i mogą dawać różne wyniki. Obie wartości p mieszczą się w obszarze marginalnie znaczącym. Może się to łatwo zdarzyć”. Myślę, że muszą istnieć lepsze sposoby, aby odpowiedzieć lekarzom na to pytanie, aby pomóc im zrozumieć różnicę między testowaniem ryzyka względnego a ryzykiem bezwzględnym. W badaniach epi problem ten pojawia się bardzo często, ponieważ często przyglądają się rzadkim zdarzeniom, w których częstość występowania w obu grupach jest bardzo mała, a wielkość próby nie jest bardzo duża. Pomyślałem o tym trochę i mam kilka pomysłów, którymi się podzielę. Ale najpierw chciałbym usłyszeć, jak niektórzy z was sobie z tym poradzą. Wiem, że wielu z was pracuje lub konsultuje się w dziedzinie medycyny i prawdopodobnie musieli zmierzyć się z tym problemem. Co byś zrobił?