Wyobraź sobie, że jesteś lekarzem na oddziale intensywnej terapii. Masz pacjenta z silną gorączką, daną liczbą komórek krwi i daną masą ciała oraz setką różnych danych i chcesz przewidzieć, czy on lub ona przeżyje. Jeśli tak, ukryje tę historię o swoim drugim dziecku dla swojej żony, jeśli nie, ważne jest, aby ujawnił ją, póki może.
Lekarz może dokonać tej prognozy na podstawie danych byłych pacjentów, których miał na oddziale. W oparciu o swoją wiedzę na temat oprogramowania potrafi przewidywać za pomocą uogólnionej regresji liniowej (glm) lub za pomocą sieci neuronowej (nn).
1. Uogólniony model liniowy
Istnieje wiele skorelowanych parametrów dla glm, więc aby dojść do wyniku, lekarz będzie musiał przyjąć założenia (liniowość itp.) I decyzje, które parametry mogą mieć wpływ. GLM nagrodzi go testem t istotności dla każdego z jego parametrów, aby mógł zebrać mocne dowody, że płeć i gorączka mają znaczący wpływ, niekoniecznie tak.
2. Sieć neuronowa
Sieć neuronowa połknie i przetrawi wszystkie informacje znajdujące się w próbce byłych pacjentów. Nie będzie miało znaczenia, czy predyktory są skorelowane i nie ujawni tylu informacji, czy wpływ masy ciała wydaje się być ważny tylko w danej próbce, czy ogólnie (przynajmniej nie na poziomie wiedzy specjalistycznej, którą lekarz ma do zaoferowania). Po prostu obliczy wynik.
Co lepsze
Wybór metody zależy od kąta patrzenia na problem: jako pacjent wolałbym sieć neuronową, która wykorzystuje wszystkie dostępne dane, aby odgadnąć, co się ze mną stanie bez silnych i oczywiście błędnych założeń, takich jak liniowość. Jako lekarz, który chce przedstawić pewne dane w czasopiśmie, potrzebuje p-wartości. Medycyna jest bardzo konserwatywna: będą prosić o wartości p. Lekarz chce więc poinformować, że w takiej sytuacji płeć ma znaczący wpływ. Dla pacjenta, to nie ma znaczenia, wystarczy użyć dowolnego wpływu, jaki próbka sugeruje jako najbardziej prawdopodobna.
W tym przykładzie pacjent chce przewidywać, strona naukowa lekarza chce wnioskować. W większości przypadków, gdy chcesz zrozumieć system, wnioskowanie jest dobre. Jeśli musisz podjąć decyzję, w której nie rozumiesz systemu, przewidywanie będzie wystarczające.