Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
Mam pewne dane, które są ograniczone od 0 do 1. Użyłem betaregpakietu w R, aby dopasować model regresji z ograniczonymi danymi jako zmienną zależną. Moje pytanie brzmi: jak interpretować współczynniki z regresji?
Załóżmy, że definiujesz: X∼Beta(α,β)X∼Beta(α,β)X\sim\mbox{Beta}(\alpha,\beta) Y∼Φ−1(X)Y∼Φ−1(X)Y\sim \Phi^{-1}(X) gdzie jest odwrotnością CDF standardowego rozkładu normalnego .Φ−1Φ−1\Phi^{-1} Moje pytanie brzmi: czy istnieje prosty rozkład, za którym podąża , czy może przybliżać ? YYYYYYPytam, ponieważ mam silne podejrzenie oparte na wynikach symulacji (pokazanych poniżej), że zbiega się do rozkładu normalnego, gdy i są wysokie, …
Według Wikipedii rozkład prawdopodobieństwa beta ma dwa parametry kształtu: i .αα\alphaββ\beta Kiedy wywołuję scipy.stats.beta.fit(x)Python, gdzie xjest wiązka liczb z zakresu , zwracane są 4 wartości. Wydaje mi się to dziwne.[0,1][0,1][0,1] Po google przeszukałem, że jedną z zwracanych wartości musi być „lokalizacja”, ponieważ trzecią zmienną jest 0, jeśli zadzwonię scipy.stats.beta.fit(x, floc=0). …
Jak jestem pewien, wszyscy już tu wiedzą, plik PDF dystrybucji Beta X∼B(a,b)X∼B(a,b)X \sim B(a,b) jest podany przez f(x)=1B(a,b)xa−1(1−x)b−1f(x)=1B(a,b)xa−1(1−x)b−1f(x) = \frac{1}{B(a,b)}x^{a-1}(1-x)^{b-1} Wszędzie szukałem wyjaśnień na temat pochodzenia tej formuły, ale nie mogę jej znaleźć. Każdy artykuł, który znalazłem w dystrybucji Beta, wydaje się podawać tę formułę, ilustrować kilka jej kształtów, a …
Badamy bayesowskie testy statystyczne i natrafiliśmy na dziwne (przynajmniej dla mnie) zjawisko. Rozważ następujący przypadek: interesuje nas pomiar, która populacja, A lub B, ma wyższy współczynnik konwersji. Dla kontroli poczytalności ustawiamy , to znaczy prawdopodobieństwo konwersji jest równe w obu grupach. Generujemy sztuczne dane przy użyciu modelu dwumianowego, np.pA=pBpA=pBp_A = …
Rozważ rozkład beta dla danego zestawu ocen w [0,1]. Po obliczeniu średniej: μ = αα + βμ=αα+β \mu = \frac{\alpha}{\alpha+\beta} Czy istnieje sposób na zapewnienie przedziału ufności wokół tego środka?
Jeśli spojrzysz na rozkład beta za pomocąα=β=4α=β=4\alpha=\beta=4 , wygląda to bardzo podobnie do rozkładu Gaussa . Ale czy to jest? Jak możesz udowodnić, czy rozkład Beta (4,4) jest gaussowski, czy nie?
Mam zestaw danych składający się z proporcji, które mierzą „poziom aktywności” poszczególnych kijanek, dzięki czemu wartości są powiązane od 0 do 1. Dane te zostały zebrane przez zliczenie liczby ruchów danej osoby w określonym przedziale czasu (1 dla ruchu, 0 za brak ruchu), a następnie uśrednia się, aby utworzyć jedną …
Bayesowska książka Kruschkego mówi o zastosowaniu dystrybucji beta do rzutu monetą, Na przykład, jeśli nie mamy wcześniejszej wiedzy innej niż wiedza, że moneta ma stronę głowy i stronę ogona, jest to równoznaczne z wcześniejszym zaobserwowaniem jednej głowy i jednego ogona, co odpowiada a = 1 i b = 1. Dlaczego …
Czy istnieje stabilny numerycznie sposób obliczania wartości rozkładu beta dla dużej liczby całkowitej alfa, beta (np. Alfa, beta> 1000000)? Właściwie potrzebuję tylko 99% przedziału ufności wokół trybu, jeśli to w jakiś sposób ułatwi problem. Dodaj : Przepraszam, moje pytanie nie było tak jasno określone, jak myślałem. Chcę to zrobić: mam …
Poniżej znajduje się fragment wprowadzenia Bolstad do statystyki bayesowskiej . Dla wszystkich tych ekspertów może to być trywialne, ale nie rozumiem, w jaki sposób autor stwierdza, że nie musimy wykonywać żadnej integracji, aby obliczyć prawdopodobieństwo późniejsze dla pewnej wartości . Rozumiem drugie wyrażenie, którym jest proporcjonalność i skąd pochodzą wszystkie …
Załóżmy, że gdzie są niezależne.X=X1+X2+⋯+XnX=X1+X2+⋯+Xn X = X_1 + X_2+\cdots+ X_n Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim N(0,\sigma^2) Moje pytanie brzmi: co robi dystrybucja Z=X2X21+X22+⋯+X2nZ=X2X12+X22+⋯+Xn2 Z = \frac{X^2}{X_1^2 + X_2^2 + \cdots + X_n^2} podążać? Wiem stąd, że stosunek dwóch losowych zmiennych chi-kwadrat wyrażonych jako zgodny z rozkładem Beta. Myślę, że ta zakłada niezależność …
Wygląda na to, że rozkład dwumianowy jest bardzo podobny w formie do rozkładu beta i że mogę ponownie sparametryzować stałe w obu plikach pdf, aby wyglądały tak samo. Dlaczego więc potrzebujemy dystrybucji wersji beta? Czy to ma konkretny cel? Dzięki!
Próbuję modelować zmienną odpowiedzi, która teoretycznie jest ograniczona między -225 a +225. Zmienna to łączny wynik uzyskany przez badanych podczas gry. Chociaż teoretycznie możliwe jest zdobycie przez uczestników +225 punktów. Pomimo tego, ponieważ wynik zależał nie tylko od działań podmiotów, ale także działań innych działań, maksymalna liczba zdobytych punktów wyniosła …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.