Załóżmy, że losowa zmienna skalarna należy do wykładniczej rodziny wektorowej o formacie pdfXXX fX(x|θ)=h(x)exp(∑i=1sηi(θ)Ti(x)−A(θ))fX(x|θ)=h(x)exp(∑i=1sηi(θ)Ti(x)−A(θ)) f_X(x|\boldsymbol \theta) = h(x) \exp\left(\sum_{i=1}^s \eta_i({\boldsymbol \theta}) T_i(x) - A({\boldsymbol \theta}) \right) gdzie θ=(θ1,θ2,⋯,θs)Tθ=(θ1,θ2,⋯,θs)T{\boldsymbol \theta} = \left(\theta_1, \theta_2, \cdots, \theta_s \right )^T to wektor parametru, a T(x)=(T1(x),T2(x),⋯,Ts(x))TT(x)=(T1(x),T2(x),⋯,Ts(x))T\mathbf{T}(x)= \left(T_1(x), T_2(x), \cdots,T_s(x) \right)^T to łączna wystarczająca statystyka. Można …
Mam zestaw danych zawierający liczbę działań wykonanych przez osoby w ciągu 7 dni. Konkretne działanie nie powinno być istotne dla tego pytania. Oto kilka statystyk opisowych dla zestawu danych: RangeMeanVarianceNumber of observations0−77218.22791696Range0−772Mean18.2Variance2791Number of observations696 \begin{array}{|c|c|} \hline \text{Range} & 0 - 772 \\ \hline \text{Mean} & 18.2 \\ \hline \text{Variance} & …
Pracuję na mocno wypaczonych danych, więc używam mediany zamiast środka do podsumowania głównej tendencji. Chciałbym mieć miary dyspersji Choć często widzę ludzi raportowania średnią odchylenie standardowe±±\pm lub mediany kwartyle±±\pm podsumowanie tendencji centralnej, to jest ok zgłosić mediana medianę bezwzględnego dyspersji (MAD)±±\pm ? Czy istnieją potencjalne problemy z tym podejściem? Uważam …
mgcvOpakowanie Rposiada dwie funkcje montowania interakcji produktów napinacz: te()i ti(). Rozumiem podstawowy podział pracy między nimi (dopasowanie interakcji nieliniowej vs. rozkładanie tej interakcji na główne efekty i interakcję). To, czego nie rozumiem, to dlaczego te(x1, x2)i ti(x1) + ti(x2) + ti(x1, x2)może powodować (nieznacznie) różne wyniki. MWE (dostosowany z ?ti): …
Biorąc pod uwagę zmienną losową , jaka jest średnia i wariancja G = 1Y= Ex p ( λ )Y=Exp(λ)Y = Exp(\lambda) ?G = 1YG=1YG=\dfrac{1}{Y} Patrzę na odwrotny rozkład gamma, ale średnia i wariancja są zdefiniowane tylko odpowiednio dla i α > 2 ...α > 1α>1\alpha>1α > 2α>2\alpha>2
Badając dwie niezależne próbki, powiedziano nam, że patrzymy na „różnicę dwóch średnich”. Oznacza to, że bierzemy średnią z populacji 1 ( ) i odejmujemy od niej średnią z populacji 2 ( ). Nasza „różnica dwóch średnich” to ( - ).y¯1y¯1\bar y_1y¯2)y¯2)\bar y_2y¯1y¯1\bar y_1y¯2)y¯2)\bar y_2 Badając sparowane próbki, powiedziano nam, że …
Częstym uproszczeniem w modelowaniu i symulacji jest zastąpienie zmiennej losowej jej wartością średnią. Kiedy to uproszczenie doprowadziłoby do błędnego wniosku?
Jak wyjaśniłbyś pojęcie średniej, mediany i trybu listy liczb i dlaczego są one ważne dla kogoś, kto ma tylko podstawowe umiejętności arytmetyczne? Nie wspominając o skośności, CLT, tendencji centralnej, ich właściwościach statystycznych itp. Wyjaśniłem komuś, że oznacza to szybki i nieprzyzwoity sposób na „podsumowanie” listy liczb. Ale patrząc wstecz, nie …
Natknąłem się na ten wyprowadzeniu których nie rozumiem: jeśli X1,X2,...,XnX1,X2,...,XnX_1, X_2, ..., X_n są losowych próbek o wymiarach N zaczerpniętych z populacji średniej μμ\mu i wariancji σ2σ2\sigma^2 , a następnie X¯=(X1+X2+...+Xn)/nX¯=(X1+X2+...+Xn)/n\bar{X} = (X_1 + X_2 + ... + X_n)/n E(X¯)=E(X1+X2+...+Xn)/n=(1/n)(E(X1)+E(X2)+...+E(Xn))E(X¯)=E(X1+X2+...+Xn)/n=(1/n)(E(X1)+E(X2)+...+E(Xn))E(\bar{X}) = E(X_1 + X_2 + ... + X_n)/n = (1/n)(E(X_1) …
Przepraszam za niewielkie nadużycie terminologii; Mam nadzieję, że stanie się jasne, co mam na myśli poniżej. Rozważmy zmienną losową . Zarówno średnią, jak i medianę można scharakteryzować za pomocą kryterium optymalności: średnia to liczba μ, która minimalizuje E ( ( X - μ ) 2 ) , oraz mediana tej …
Mam GLMM w postaci: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kiedy używam drop1(model, test="Chi"), otrzymuję inne wyniki niż w przypadku korzystania Anova(model, type="III")z pakietu samochodowego lub summary(model). Te dwa ostatnie dają te same odpowiedzi. Korzystając z wielu sfabrykowanych danych, odkryłem, że te …
Załóżmy, że mamy dostęp do próbek iid z rozkładu o prawdziwej (nieznanej) średniej i wariancji , i chcemy oszacować .μ ,σ2)μ,σ2)\mu, \sigma^2μ2)μ2)\mu^2 Jak zbudować obiektywny, zawsze pozytywny estymator tej ilości? Biorąc kwadrat próbki, średnia jest tendencyjna i zawyża ilość, szczególnie. jeśli jest bliskie 0, a jest duże.μ~2)μ~2)\tilde{\mu}^2μμ\muσ2)σ2)\sigma^2 To być może …
Załóżmy, że mam minimum, średnią i maksimum niektórych zbiorów danych, powiedzmy 10, 20 i 25. Czy istnieje sposób na: utworzyć dystrybucję na podstawie tych danych oraz wiedzieć, jaki procent populacji prawdopodobnie leży powyżej lub poniżej średniej Edytować: Zgodnie z sugestią Glen'a załóżmy, że mamy próbkę o wielkości 200.
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.