Znaczenie reprezentowania simpleksu jako powierzchni trójkąta w rozkładzie Dirichleta?

Czytam z książki, która przedstawia dystrybucję Dirchilet, a następnie przedstawiłam dane na jej temat. Ale tak naprawdę nie byłem w stanie zrozumieć tych liczb. Dołączyłem figurę tutaj na dole. To, czego nie rozumiem, to znaczenie trójkątów.

Zwykle, gdy chce się wykreślić funkcję 2 zmiennych, bierze się wartość var1 i va2, a następnie wykreśla wartość wartości funkcji tych dwóch zmiennych ... co daje wizualizację w wymiarze 3D. Ale tutaj są 3 wymiary i jedna inna wartość dla wartości funkcji, więc tworzy wizualizację w przestrzeni 4D. Nie rozumiem tych liczb!

Mam nadzieję, że ktoś może je wyjaśnić!

EDYTOWAĆ: oto czego nie rozumiem z rysunku 2.14a. Narysowaliśmy więc z K = 3 dirichlet próbkę theta (która jest w zasadzie wektorem), czyli: theta = [theta1, theta2, theta3]. Wykresy trójkąta [theta1, theta2, theta3]. Odległość od początku do każdego theta_i jest wartością theta_i. Następnie dla każdego theta_i umieścił wierzchołek i połączył wszystkie trzy wierzchołki i utworzył trójkąt. Wiem, że jeśli podłączę [theta1, theta2, theta3] do dir (theta | a), otrzymam jedną liczbę, która jest wspólnym prawdopodobieństwem wektora theta. Rozumiem również, że prawdopodobieństwo ciągłych zmiennych losowych jest miarą obszaru. Ale tutaj mamy 3 wymiary, więc prawdopodobieństwo połączenia będzie miarą objętości przestrzeni od różowej płaszczyzny i pod ... tj. Piramidą. Teraz nie rozumiem, jaka jest tutaj rola trójkąta.

wprowadź opis zdjęcia tutaj

distributions data-visualization dirichlet-distribution

— Jack Twain
źródło

Sugeruję, aby zacząć od dystrybucji wersji beta i rozpocząć pracę od tego miejsca. Dirichlet dla 3 jest „tylko” logicznym rozszerzeniem wersji beta, którą jest Dirichlet dla 2

— Andris Birkmanis

Sprawdź ten wątek na przykład: stats.stackexchange.com/questions/244917/…

— Tim

Pomocne może być myślenie, że rozkład Beta jest pokazany w 2D (oś x reprezentująca wynik binarny {0,1} i oś y reprezentująca prawdopodobieństwo), więc wynik potrójny potrzebuje dodatkowego wymiaru, prawda?

— George

Odpowiedzi:

Nie rozumiem, jaka jest tutaj rola trójkąta. Co próbuje się komunikować lub wizualizować?

Wszystkie punkty w trójkącie muszą spełniać dwa ograniczenia: od zera do jednego w każdym wymiarze ( $0 \leq \theta \leq 1$ ) i wszystkie sumują się do jednego ( $\theta_0 + \theta_1 + \theta_2 = 1$ ).

Sposób, w jaki to ostatecznie zrozumiałem, jest następujący:

postać

Więc (a) pokazuje przestrzeń 3-D z $\theta_{1, 2, 3}$ jako współrzędne. Wynoszą tylko od 0 do 1.

W (b) pokazano trójkąt, to jest nasz simpleks.

(c) pokazuje dwa przykładowe punkty, które „leżą” na simpleksie, które spełniają również drugie kryterium (sumuje się do jednego).

(d) pokazuje inny przykładowy punkt na simpleksie, zachowują się te same ograniczenia

W (e) próbowałem pokazać rzut prostego trójkąta 2-D ze wszystkimi przykładowymi punktami pokazanymi wcześniej.

Mam nadzieję, że teraz ma to większy sens :)

— nieznany z nazwiska
źródło

Ładne zdjęcie. Czy to twoje? Jeśli nie, czy możesz podać referencję i jej źródło?

— Tim

Dzięki. Jest mój (narysowany za pomocą Inkscape), w razie potrzeby mogę dostarczyć plik SVG ...

— John Doe

Wykres 2.14 (a) pokazuje płaszczyznę złożoną z trzech wierzchołków na każdej osi. Odległość wierzchołka od początku wynosi $\theta_i$ , odpowiadający jednemu z $k=3$ zajęcia Obszar objęty różową płaszczyzną i płaszczyznami osi jest prawdopodobieństwem (wektor) $\theta$ . Załóżmy teraz, że przechylasz tę płaszczyznę, tak aby piramida z różową płaszczyzną, twarzą najbliższą czytnikowi, była umieszczona płasko na stronie. Następnie pomiń trzeci wymiar „wyskakiwanie” strony i zamiast tego pokoloruj trójkąt, aby obszar o większej gęstości, z większą odległością od podstawy do powierzchni, był bardziej czerwony. Tak pokazują wykresy 2.14 (b) i 2.14 (c). Im bardziej czerwony jest skoncentrowany w pobliżu wierzchołka, tym bardziej prawdopodobna jest klasa związana z tym wierzchołkiem. Podobnie, jeśli czerwony region nie znajduje się bardzo blisko żadnego wierzchołka, nie jest szczególnie prawdopodobne, aby zdarzenie miało większe prawdopodobieństwo członkostwa w którejkolwiek z klas.

Ta piramida ma jednak sens tylko jako jedna realizacja rozkładu Dirichleta. Ponowne rysowanie z tego samego rozkładu może dać inną piramidę o różnych długościach $\theta$ do każdego z wierzchołków. Kluczowa różnica między (a) i (b) / (c) polega na tym, że (a) graficznie pokazuje prawdopodobieństwo jednego losowania wektora $\theta$ . Wykresy (b) i (c) pokazują gęstość prawdopodobieństwa dla wartości $\theta$ w $k=3$ simplex, czyli próbują przedstawić funkcję gęstości prawdopodobieństwa dla wszystkich wartości $\theta$ we wsparciu. Jednym ze sposobów myślenia o (b) i (c) jest punkt mający dodatkowy czerwony kolor zgodnie ze średnią wysokością między płaską różową płaszczyzną a powierzchnią piramidy, uśrednioną dla wielu rysunków $\theta\sim\text{Dir}(\alpha)$ .

— Sycorax mówi Przywróć Monikę
źródło

Niektóre punkty wciąż nie są jasne. Może z powodu mojego słabego angielskiego. „Obszarem otoczonym różową płaszczyzną i płaszczyznami osi jest gęstość”. Czy to pusta przestrzeń piramidy pod różową płaszczyzną? Również „gęstość”? Co masz na myśli? Rozumiem, że dir (x1, x2, x3) to jedna wartość, w jaki sposób gęstość pojawia się na wykresie?

— Jack Twain

Tak, między różową płaszczyzną a płaszczyznami utworzonymi przez czarne linie w 2.14 (a) jest przestrzeń piramidy, którą próbowałem opisać. Przepraszam za zamieszanie!

— Sycorax mówi Przywróć Monikę

Zmodyfikuję swój post, aby wyjaśnić, co jeszcze nie jest jasne

— Jack Twain

Chodzi o to, że różowy region to właśnie wsparcie opisane w książce. ponieważ theta_k <= 1 i suma (theta_k) = 1. Gdy to sobie wyobrazisz, użytkownik777 ma całkowitą rację.

— Scratch

@ user777 Właśnie dokonałem edycji postu

— Jack Twain