Jeśli podam dwa kwantyle i odpowiadające im lokalizacje (każdy) w przedziale otwartym , czy zawsze mogę znaleźć parametry rozkładu beta, który ma te kwantyle w określonych lokalizacjach?
Jeśli podam dwa kwantyle i odpowiadające im lokalizacje (każdy) w przedziale otwartym , czy zawsze mogę znaleźć parametry rozkładu beta, który ma te kwantyle w określonych lokalizacjach?
Odpowiedzi:
Odpowiedź brzmi tak, pod warunkiem, że dane spełniają oczywiste wymagania dotyczące spójności. Argument jest prosty, oparty na prostej konstrukcji, ale wymaga pewnej konfiguracji. Sprowadza się to do intuicyjnie interesującego faktu: zwiększenie parametru w rozkładzie Beta zwiększa wartość jego gęstości (PDF) bardziej dla większych niż mniejszych ; a zwiększenie robi coś przeciwnego: im mniejsze , tym bardziej rośnie wartość pliku PDF.
Szczegóły podano poniżej.
Niech pożądanym kwantylem będzie a pożądanym kwantylem będzie z i (dlatego) . Wtedy istnieje unikalna i , dla których Beta podział ma te quantiles.
Trudność z wykazaniem tego polega na tym, że rozkład Beta obejmuje oporną stałą normalizującą. Przypomnijmy definicję: dla i rozkład Beta ma funkcję gęstości (PDF)
Stałą normalizującą jest funkcja Beta
Wszystko staje Messy jeśli spróbujemy do odróżnienia bezpośrednio w odniesieniu do i , co byłoby sposobem brute force próba demonstracji.
Jednym ze sposobów uniknięcia konieczności analizowania funkcji Beta jest zwrócenie uwagi, że kwantyle to obszary względne . To jest,
dla . Oto, na przykład, PDF i funkcja dystrybucji skumulowanej (CDF) rozkładu Beta dla których i .
Funkcja gęstości jest wykreślona po lewej stronie. to obszar pod krzywą po lewej stronie , pokazany na czerwono, w stosunku do całkowitego obszaru pod krzywą. jest obszarem po lewej stronie , równym sumie obszarów czerwonych i niebieskich, ponownie w stosunku do całkowitego obszaru . CDF po prawej pokazuje, jak i zaznaczają na nim dwa odrębne punkty.
Na tym rysunku ustalono na , wybrano na , a następnie znaleziono wartość dla której leży na Beta CDF.
Lemma : Takie zawsze można znaleźć.
Mówiąc konkretnie, niech zostanie naprawione raz na zawsze. (Pozostają takie same na poniższych ilustracjach: we wszystkich trzech przypadkach względny obszar po lewej stronie jest równy .) Dla dowolnego Lemma twierdzi, że istnieje unikalna wartość , zapisana dla których jest kwantylem rozkładu Beta .
Aby zobaczyć dlaczego, zauważ najpierw, że gdy zbliża się do zera, wszystkie prawdopodobieństwa zbliżają się do wartości , skąd zbliża się do . Gdy zbliża się do nieskończoności, wszystkie prawdopodobieństwa zbliżają się do wartości , skąd zbliża się do . W międzyczasie funkcja ściśle rośnie .
To twierdzenie jest geometrycznie oczywiste: sprowadza się do powiedzenia, że jeśli spojrzymy na obszar po lewej stronie pod krzywą stosunku do całkowitego pola pod krzywą i porównaj to do względnego obszaru pod krzywą dla , to ten drugi obszar jest stosunkowo większy. Stosunek tych dwóch funkcji wynosi . Jest to funkcja równa gdy stopniowo spada do gdy Dlatego wysokości funkcji są stosunkowo większe niż wysokości od dla na lewo od niż dla na prawo od W związku z tym obszar po lewej stronie w pierwszym musi być stosunkowo większy niż obszar po prawej stronie (Można to na przykład łatwo przełożyć na rygorystyczny argument przy użyciu sumy Riemanna).
Zauważyliśmy, że funkcja rośnie ściśle monotonicznie z wartościami granicznymi odpowiednio i jako i . Jest także (wyraźnie) ciągły. W związku z tym istnieje liczba gdzie a liczba ta jest unikalna, co potwierdza lemat.
Ten sam argument pokazuje, że wraz ze wzrostem zwiększa się obszar po lewej stronie . W związku z tym wartości zakres, w pewnym odstępie od liczby jak postępuje od prawie do prawie Limit jako wynosi
Oto przykład, w którym jest bliskie (wynosi ). Przy i (jak na poprzednim rysunku), Pomiędzy a prawie nie ma obszaru
CDF jest praktycznie płaski między a skąd jest praktycznie na szczycie W limicie jako ,
Na drugim końcu, na tyle duże wartości prowadzą do dowolnie blisko Oto przykład z jak poprzednio.
Tutaj i jest prawie Teraz jest w zasadzie prawie nie ma obszar na prawo od
W związku z tym możesz wybrać dowolną między a i regulować aż Podobnie jak poprzednio, to musi być unikalny, QED .
R
Kod roboczy znajdujący rozwiązania jest publikowany w części Określanie parametrów dystrybucji beta i z dwóch dowolnych punktów (kwantyli) .