Pomyśl o jako zestawie biletów . Możesz pisać rzeczy na bilecie. Zwykle bilet zaczyna się od imienia osoby lub obiektu w świecie rzeczywistym, który „reprezentuje” lub „modeluje”. Na każdym bilecie jest dużo wolnego miejsca na pisanie innych rzeczy.S
Możesz wykonać tyle kopii każdego biletu, ile chcesz. Model prawdopodobieństwa dla tej populacji świata rzeczywistego lub procesu polega na wykonaniu jednego lub więcej kopii każdego biletu, mieszając je i umieszczając je w pudełku. Jeśli ty - analityk - potrafisz ustalić, że proces losowego losowania jednego biletu z tego pola naśladuje wszystkie ważne zachowania tego, czego się uczysz, wtedy możesz dowiedzieć się wiele o świecie, myśląc o tym polu. Ponieważ niektóre bilety mogą być liczniejsze w pudełku niż inne, mogą mieć różne szanse na wylosowanie. Teoria prawdopodobieństwa bada te szanse.P
Gdy liczby są zapisywane na biletach (w spójny sposób), powodują one rozkład (prawdopodobieństwa). Rozkład prawdopodobieństwa jedynie opisuje część biletów w pudełku, którego numery mieszczą się w danym przedziale czasu.
Ponieważ zwykle nie wiemy dokładnie, jak zachowuje się świat, musimy sobie wyobrazić różne skrzynki, w których bilety pojawiają się z różnymi częstotliwościami względnymi. Zestaw tych pól to . Uważamy, że świat jest odpowiednio opisany przez zachowanie jednego z pól w . Twoim celem jest racjonalne odgadnięcie, które to pudełko, na podstawie tego, co widzisz na biletach, które wyciągnąłeś z niego.PPP
Jako przykład , (który jest praktyczny i realistyczna nie zabawka podręcznik) załóżmy, że badania szybkości reakcji chemicznej, jak to zmienia się wraz z temperaturą. Załóżmy, że teoria chemii przewiduje, że w zakresie temperatur od do stopni szybkość jest proporcjonalna do temperatury.0 100y0100
Planujesz zbadać tę reakcję zarówno w temperaturze jak i stopni, dokonując kilku obserwacji w każdej temperaturze. Tworzysz zatem bardzo, bardzo dużą liczbę pudełek. Wypełnisz każde pudełko biletami. Na każdym zapisana jest stała szybkości. Wszystkie bilety w danym polu mają zapisaną tę samą stałą stawki. Różne pola używają różnych stałych szybkości. 1000100
Używając stałej szybkości zapisanej na dowolnym bilecie, zapisujesz również stawkę przy i stawkę przy stopniach: zadzwoń do tych i . Ale to jeszcze nie wystarczy na dobry model. Chemicy wiedzą również, że żadna substancja nie jest czysta, żadna ilość nie jest dokładnie mierzona i występują inne formy zmienności obserwacyjnej. Aby wymodelować te „błędy”, wykonujesz bardzo, bardzo wiele kopii swoich biletów. Na każdej kopii zmieniasz wartości i . W większości z nich zmieniasz je tylko trochę. W niektórych przypadkach możesz je bardzo zmienić. Zapisujesz tyle zmienionych wartości, ile planujesz zaobserwować w każdej temperaturze. Te obserwacje przedstawiają możliwe0100y0y100y0y100obserwowalne wyniki eksperymentu. W polu przejść każdy taki zestaw tych biletów: jest to model prawdopodobieństwa do czego może obserwować dla danej stałej szybkości.
To, co obserwujesz, jest modelowane poprzez wyciągnięcie biletu z tego pudełka i przeczytanie tylko zapisanych tam obserwacji. Nie zobaczysz podstawowych (prawdziwych) wartości lub . Nie można odczytać (prawdziwej) stałej szybkości. Nie są one dostępne w twoim eksperymencie.y0y100
Każdy model statystyczny musi przyjmować pewne założenia dotyczące biletów w tych (hipotetycznych) polach. Na przykład, mamy nadzieję, że kiedy zmodyfikujesz wartości i , zrobiłeś to bez konsekwentnego zwiększania lub konsekwentnego zmniejszania jednego (jako całości, w ramce): byłoby to formą systematycznego uprzedzenia.y0y100
Ponieważ obserwacje zapisane na każdym bilecie są liczbami, powodują rozkład prawdopodobieństwa. Założenia dotyczące pól są zazwyczaj sformułowane w kategoriach właściwości tych rozkładów, takich jak to, czy muszą one uśredniać do zera, być symetryczne, mieć kształt „krzywej dzwonowej”, są nieskorelowane lub cokolwiek innego.
To naprawdę wszystko. Podobnie jak prymitywna dwunastotonowa skala dała początek zachodniej muzyce klasycznej, kolekcja pudełek z biletami to prosta koncepcja, którą można wykorzystać w niezwykle bogaty i złożony sposób. Może modelować niemal wszystko, od rzutu monetą po bibliotekę filmów, bazy danych interakcji z witryną, zespoły mechaniki kwantowej i wszystko, co można zaobserwować i nagrać.