Moje doświadczenie dotyczy głównie uczenia maszynowego i starałem się dowiedzieć, co oznacza testowanie hipotezy bayesowskiej. Nie przeszkadza mi bayesowska interpretacja prawdopodobieństwa i znam ją w kontekście probabilistycznych modeli graficznych. Jednak mylę mnie to, co oznacza słowo „hipoteza” w kontekście wnioskowania statystycznego.
Wydaje mi się, że najczęściej mylę się ze słownictwem, do którego jestem przyzwyczajony w uczeniu maszynowym, w porównaniu do tego, co zwykle stosuje się w statystykach i wnioskowaniu.
W kontekście nauki nadzorowanej normalnie myślę o hipotezie jako o funkcji predykcyjnej, która odwzorowuje przykłady na etykiety, tj. . Wydaje mi się jednak, że termin hipoteza w czytanych przeze mnie odczytach nie ma tego samego znaczenia. Pozwól mi wkleić fragment czytanych odczytów:

Jeśli czytasz uważnie, mówi również:
istnieje inny model obserwowanych danych ...
gdyby używali słowa model. Dla mnie słowo model przypomina mi zestaw funkcji, w których wybraliśmy konkretną funkcję predykcyjną. tj. hipoteza klasy funkcji. Na przykład może być klasą hipotez funkcji kwadratowych (wielomian stopnia 2). Wydaje mi się jednak, że używają słowa model i hipotezy jako synonimów w tym wyciągu (gdzie dla mnie są to zupełnie inne słowa).
Następnie wspomina, że możemy postawić hipotezę priory (całkowicie rozsądną rzecz do zrobienia w otoczeniu bayesowskim):
możemy również scharakteryzować dane za pomocą aktualnej hipotezy:
i zaktualizuj nasze obecne przekonania, podając niektóre dane (i zasadę Baye'a):
Wydaje mi się jednak, że bardziej przyzwyczajam się do szacowania bayesowskiego konkretnego parametru (powiedzmy ) z klasy hipotez niż z całej klasy hipotez. Zasadniczo, ponieważ wydaje się, że te „hipotezy” nie są tymi samymi hipotezami z kontekstu uczenia maszynowego, do których jestem przyzwyczajony, wydaje mi się, że te hipotezy są bardziej podobne do określonego parametru niż do klasy hipotez.
W tym momencie byłem przekonany, że „hipoteza” oznaczała to samo, co w funkcji predykcyjnej (na przykład parametryzowanej parametrem ), ale myślę, że się myliłem ...
Żeby moje zamieszanie było jeszcze gorsze, później te same lektury posunęły się naprzód, aby określić konkretną „hipotezę” dla każdego zaobserwowanego przykładu treningu. Pozwól mi wkleić wyciąg z tego, co mam na myśli:

powodem tego jest fakt, że jeśli interpretuję hipotezę jako parametr, to dla mnie nie ma sensu określać konkretnego parametru dla każdej wartości próbki, którą widzimy. W tym momencie doszedłem do wniosku, że tak naprawdę nie wiedziałem, co mają na myśli hipotezę, więc zadałem to pytanie.
Jednak nie poddałem się w pełni, zbadałem, co hipoteza oznacza w statystykach dla osób często odwiedzających i znalazłem następujący film z akademii chana . Ten film ma dla mnie wiele sensu (być może jesteś częstym!) . Wydaje się jednak, że uzyskują wiązkę danych (jak jakiś „zestaw próbek”) i na podstawie właściwości zestawu próbek decydują, czy przyjąć, czy odrzucić hipotezę zerową o danych. Jednak w kontekście bayesowskim, które czytam, wydaje mi się, że dla każdego obserwowanego wektora [punktowego] „etykietują go” hipotezą za pomocą „testu ilorazu wiarygodności”:

Sposób, w jaki przypisują hipotezę do każdej próbki danych, wydaje się nawet nadzorowanym ustawieniem uczenia się, jeśli dołączamy etykietę do każdego zestawu treningowego. Nie sądzę jednak, aby robili to w tym kontekście. Co oni robią? Co to znaczy przypisać hipotezę do każdej próbki danych? Jakie jest znaczenie hipotezy? Co oznacza słowo model?
Zasadniczo, po tym długim wyjaśnieniu mojego zamieszania, czy ktoś wie, co w tym kontekście oznacza testowanie bayesowskie?
Jeśli potrzebujesz wyjaśnień lub czegokolwiek, aby poprawić moje pytanie lub aby pytanie miało sens, chętnie pomogę :)
W poszukiwaniu odpowiedzi znalazłem kilka użytecznych rzeczy związanych z testowaniem hipotez statystycznych:
Ten odnosi się do dobrego wprowadzenia do tematu, jeśli pochodzisz z CS (jak ja):
Jakie jest dobre wprowadzenie do testowania hipotez statystycznych dla informatyków?
W pewnym momencie zapytałem o „parametry domyślne” (które powinienem był zdefiniować, co miałem na myśli. Myślałem, że to standardowy termin, ale tak nie jest, więc tutaj się nim zajmę) i myślę, że naprawdę miałem na myśli to, jak określasz parametry dla każdej twojej hipotezy. Na przykład, jak zdecydować, jaka jest twoja hipoteza zerowa i jakie są jej parametry. Jest z tym związane pytanie:
