Jaka jest różnica w znaczeniu między zapisem i które są powszechnie używane w wielu książkach i artykułach?P ( z | d , w )
Jaka jest różnica w znaczeniu między zapisem i które są powszechnie używane w wielu książkach i artykułach?P ( z | d , w )
Odpowiedzi:
Wierzę, że źródłem tego jest paradygmat prawdopodobieństwa (chociaż nie sprawdziłem faktycznej poprawności historycznej poniżej, jest to rozsądny sposób zrozumienia, jak powstało iot).
Powiedzmy, że w ustawieniu regresji miałbyś rozkład: p (Y | x, beta) Co oznacza: rozkład Y, jeśli znasz (warunkowo) wartości x i beta.
Jeśli chcesz oszacować bety, chcesz zmaksymalizować prawdopodobieństwo: L (beta; y, x) = p (Y | x, beta) Zasadniczo patrzysz teraz na wyrażenie p (Y | x, beta) jako funkcja beta, ale poza tym nie ma różnicy (w przypadku poprawnych wyrażeń matematycznych, które można poprawnie wyprowadzić, jest to konieczność --- chociaż w praktyce nikt nie przeszkadza).
Następnie, w ustawieniach bayesowskich, różnica między parametrami i innymi zmiennymi wkrótce zanika, więc jeden zaczął używać obu notacji z domieszkami.
Zasadniczo: nie ma rzeczywistej różnicy: oba wskazują warunkową dystrybucję rzeczy po lewej stronie, zależną od rzeczy po prawej stronie.
to gęstość zmiennej losowej X w punkcie x , przyczym θ jest parametrem rozkładu. f ( x , θ ) to łączna gęstość X i Θ w punkcie ( x , θ ) i ma sens tylko wtedy, gdy Θ jest zmienną losową. f ( x | θ ) jest rozkładem warunkowym X podanym Θ i znowu ma sens tylko wtedy, gdy jest zmienną losową. Stanie się to znacznie wyraźniejsze, gdy zagłębisz się w książkę i przyjrzysz się analizie bayesowskiej.
jest takie samo jak , co oznacza po prostu, że jest stałym parametrem, a funkcja jest funkcją . , OTOH, jest elementem rodziny (lub zestawu) funkcji, w którym elementy są indeksowane przez . Może subtelne rozróżnienie, ale ważne, zwłaszcza. kiedy przychodzi czas na oszacowanie nieznanego parametru na podstawie znanych danych ; w tym czasie zmienia, ajest naprawiony, co powoduje „funkcję wiarygodności”. Użycie jest bardziej powszechne wśród statystyk, natomiast wśród matematyków.
Chociaż nie zawsze tak było, obecnie jest zwykle używane, gdy d , w nie są zmiennymi losowymi (co nie znaczy, że są one koniecznie znane). P ( z | d , w ) oznacza warunkowanie na wartościach d , w . Uwarunkowanie jest operacją na zmiennych losowych i jako takie użycie tej notacji, gdy d , w nie są zmiennymi losowymi, jest mylące (i tragicznie powszechne).