Krótka odpowiedź na twoje pytanie brzmi: „przez większość czasu nie wiemy, co to jest P (ser), i często (względnie) trudno to obliczyć”.
Dłuższa odpowiedź na pytanie, dlaczego reguła / twierdzenie Bayesa jest zwykle wyrażona w sposób, w jaki napisałeś, to dlatego, że w problemach bayesowskich mamy - siedząc na kolanach - wcześniejszy rozkład (P (B) powyżej) i prawdopodobieństwo (P (A | B), P (A | notB) powyżej) i względnie prosta kwestia mnożenia polega na obliczeniu tylnej (P (B | A)). Trudność ponownego wyrażenia P (A) w jego skróconej formie jest wysiłkiem, który można by wydać gdzie indziej.
Może to nie wydawać się tak skomplikowane w kontekście wiadomości e-mail, ponieważ, jak słusznie zauważyłeś, to tylko P (ser), prawda? Problem polega na tym, że przy bardziej zaangażowanych problemach bayesowskich na polu bitwy mianownik jest brzydką całką, która może mieć rozwiązanie w formie zamkniętej. W rzeczywistości czasami potrzebujemy wyrafinowanych metod Monte Carlo tylko do przybliżenia całki, a ubijanie liczb może być prawdziwym bólem z tyłu.
Co więcej, zwykle nie obchodzi nas nawet, czym jest P (ser). Pamiętaj, że staramy się podnieść naszą wiarę w to, czy wiadomość e-mail jest spamem , i nie przejmowaliśmy się marginalnym rozkładem danych (P (A) powyżej). W każdym razie jest to tylko stała normalizacyjna, która nie zależy od parametru; czynność sumowania usuwa wszystkie informacje o parametrze. Stała jest uciążliwa do obliczenia i jest ostatecznie nieistotna, jeśli chodzi o sprawdzenie naszych przekonań na temat tego, czy spam e-mail jest, czy nie. Czasami jesteśmy zobowiązani do obliczenia tego, w którym to przypadku najszybszym sposobem jest skorzystanie z informacji, które już mamy: wcześniejsze i prawdopodobieństwo.