Artykuł The Odds, Continually Updated wspomina historię rybaka z Long Island, który dosłownie zawdzięcza swoje życie Bayesian Statistics. Oto krótka wersja:
W środku nocy na łodzi jest dwóch rybaków. Podczas gdy jeden śpi, drugi wpada do oceanu. Łódź cały czas trolluje autopilotem przez całą noc, aż pierwszy facet w końcu się obudzi i powiadomi Straż Przybrzeżną. Coast Guard używa oprogramowania o nazwie SAROPS (Search and Rescue Optimal Planning System), aby znaleźć go w samą porę, ponieważ był hipotermiczny i prawie nie miał energii, aby pozostać na powierzchni.
Oto długa wersja: A Speck In The Sea
Chciałem dowiedzieć się więcej o tym, jak faktycznie stosuje się tutaj twierdzenie Bayesa. Dość sporo dowiedziałem się o oprogramowaniu SAROPS, po prostu google.
Symulator SAROPS
Komponent symulatora uwzględnia aktualne dane, takie jak prąd oceaniczny, wiatr itp., I symuluje tysiące możliwych ścieżek dryfu. Z tych ścieżek dryfu tworzona jest mapa rozkładu prawdopodobieństwa.
Zwróć uwagę, że poniższe grafiki nie odnoszą się do przypadku zaginionego rybaka, o którym wspomniałem powyżej, ale są zabawkowym przykładem zaczerpniętym z tej prezentacji
Mapa prawdopodobieństwa 1 (kolor czerwony oznacza najwyższe prawdopodobieństwo; kolor niebieski najniższy)
Zwróć uwagę na koło, które jest początkową lokalizacją.
Mapa prawdopodobieństwa 2 - Minęło więcej czasu
Zauważ, że mapa prawdopodobieństwa stała się multimodalna. Jest tak, ponieważ w tym przykładzie uwzględniono wiele scenariuszy:
- Osoba unosi się w wodzie - tryb góra-środek
- Osoba jest w tratwie ratunkowej (bardziej dotknięta wiatrem z północy) - dolne 2 tryby (podzielone z powodu „efektów jibing”)
Mapa prawdopodobieństwa 3 - Wyszukiwanie zostało przeprowadzone wzdłuż prostokątnych ścieżek w kolorze czerwonym. Zdjęcie przedstawia optymalne ścieżki utworzone przez planistę (inny element SAROPS). Jak widać, ścieżki te zostały przeszukane, a mapa prawdopodobieństwa została zaktualizowana przez symulator.
Być może zastanawiasz się, dlaczego przeszukane obszary nie zostały zredukowane do zera. Wynika to z faktu, że istnieje prawdopodobieństwo niepowodzenia, , uwzględnione, to znaczy, że istnieje znacząca szansa, że poszukiwacz przeoczy osobę w wodzie. Zrozumiałe jest, że prawdopodobieństwo awarii jest o wiele wyższe dla samotnej osoby na wodzie niż dla osoby na tratwie ratunkowej (łatwiej ją zobaczyć), dlatego prawdopodobieństwo w górnej części nie spadło zbytnio.
Skutki nieudanego wyszukiwania
Właśnie tutaj pojawia się twierdzenie Bayesa. Po przeprowadzeniu wyszukiwania mapa prawdopodobieństwa jest odpowiednio aktualizowana, dzięki czemu można optymalnie zaplanować kolejne wyszukiwanie.
Po przejrzeniu Twierdzenia Bayesa na wikipedii oraz w artykule Intuicyjne (i krótkie) objaśnienie Twierdzenia Bayesa na BetterExplained.com
Wziąłem równanie Bayesa:
I zdefiniował A i X w następujący sposób ...
Zdarzenie A: Osoba znajduje się w tym obszarze (komórka siatki)
Test X: nieudane wyszukiwanie w tym obszarze (komórka siatki), tzn. Przeszukano ten obszar i nic nie widziałem
Wydajność,
Odkryłem w Search and Rescue Optimal Planning System, że SAROPS oblicza prawdopodobieństwo nieudanego wyszukiwania , biorąc pod uwagę ścieżki wyszukiwania i symulowane ścieżki dryfu. Dla uproszczenia załóżmy, że wiemy, jaka jest wartość .P ( fail )
Więc teraz mamy
Czy równanie Bayesa jest tutaj stosowane poprawnie?
Jak obliczyć mianownik, prawdopodobieństwo nieudanego poszukiwania?
Również w Search and Rescue Optymalny system planowania , mówią
Wcześniejsze prawdopodobieństwa są „normalizowane w zwykły sposób bayesowski” w celu uzyskania prawdopodobieństw późniejszych
Co oznacza „znormalizowany w normalny sposób bayesowski” ?
Czy to oznacza, że wszystkie prawdopodobieństwa są podzielone przez , czy po prostu znormalizowane, aby cała mapa prawdopodobieństwa sumowała się do jednego? Czy te są takie same?
Wreszcie, jaki byłby właściwy sposób normalizacji siatki prawdopodobieństwa po siatce po zaktualizowaniu pod kątem nieudanego wyszukiwania, biorąc pod uwagę, że ponieważ nie przeszukiwałeś WSZYSTKICH obszarów (komórek siatki), miałbyś niektóre komórki równe i niektóre równe ?
Jeszcze jedna uwaga dotycząca uproszczenia - według systemu optymalnego planowania Search and Rescue rozkład tylny jest w rzeczywistości obliczany przez aktualizację prawdopodobieństw symulowanych ścieżek dryftu, a następnie NAWRACANIE siatkowej mapy prawdopodobieństwa. Aby uprościć ten przykład, postanowiłem zignorować ścieżki SIM i skupić się na komórkach siatki.