Rozważ losową zmienną gamma . Istnieją zgrabne wzory na średnią, wariancję i skośność:X∼Γ(α,θ)X∼Γ(α,θ)X\sim\Gamma(\alpha, \theta) E[X]Var[X]Skewness[X]=αθ=αθ2=1/α⋅E[X]2=2/α−−√E[X]=αθVar[X]=αθ2=1/α⋅E[X]2Skewness[X]=2/α\begin{align} \mathbb E[X]&=\alpha\theta\\ \operatorname{Var}[X]&=\alpha\theta^2=1/\alpha\cdot\mathbb E[X]^2\\ \operatorname{Skewness}[X]&=2/\sqrt{\alpha} \end{align} Rozważmy teraz zmienną losową przekształconą logarytmicznie . Wikipedia podaje wzory na średnią i wariancję:Y=log(X)Y=log(X)Y=\log(X) E[Y]Var[Y]=ψ(α)+log(θ)=ψ1(α)E[Y]=ψ(α)+log(θ)Var[Y]=ψ1(α)\begin{align} \mathbb E[Y]&=\psi(\alpha)+\log(\theta)\\ \operatorname{Var}[Y]&=\psi_1(\alpha)\\ \end{align} poprzez funkcje digamma i trigamma, które są zdefiniowane jako pierwsza …
W większości przypadków, gdy ludzie mówią o transformacjach zmiennych (zarówno dla zmiennych predykcyjnych, jak i zmiennych odpowiedzi), dyskutują o sposobach leczenia skośności danych (takich jak transformacja logów, transformacja box i Cox itp.). Nie jestem w stanie zrozumieć, dlaczego usuwanie skośności jest uważane za tak powszechną najlepszą praktykę? W jaki sposób …
Mam próbki z mocno wypaczonego (wyglądającego jak rozkład wykładniczy) zestawu danych o udziale użytkowników (np. Liczba postów), które mają różne rozmiary (ale nie mniej niż 200) i chcę porównać ich średnią. W tym celu używam dwóch prób niesparowanych testów t (i testów t ze współczynnikiem Welcha, gdy próbki miały różne …
Chciałbym znaleźć metodę generowania skorelowanych, nienormalnych danych. Idealnie więc jakiś rodzaj rozkładu, który przyjmuje parametr kowariancji (lub korelacji) jako parametr i generuje dane, które ją przybliżają. Ale tutaj jest haczyk: metoda, którą próbuję znaleźć, powinna mieć elastyczność, aby kontrolować również jej wielowymiarową skośność i / lub kurtozę. Znam metodę Fleishmana …
Często wprowadzane teksty statystyki statystycznej odróżniają średnią od mediany (często w kontekście statystyki opisowej i motywując do podsumowania tendencji centralnej za pomocą średniej, mediany i trybu), wyjaśniając, że średnia jest wrażliwa na wartości odstające w danych próbki i / lub do wypaczonych rozkładów populacji, co służy uzasadnieniu twierdzenia, że mediana …
Czy ktoś może podać intuicję, dlaczego wyższe momenty rozkładu prawdopodobieństwa , podobnie jak moment trzeci i czwarty, odpowiadają odpowiednio skośności i kurtozie? W szczególności dlaczego odchylenie dotyczące średniej podniesionej do trzeciej lub czwartej potęgi ostatecznie przekłada się na miarę skośności i kurtozy? Czy istnieje sposób na odniesienie tego do trzeciej …
Załóżmy, że mam zmienną, której rozkład jest wypaczony w bardzo dużym stopniu pozytywnie, tak że pobranie logu nie będzie wystarczające, aby umieścić go w zakresie skośności dla rozkładu normalnego. Jakie są moje opcje w tym momencie? Co mogę zrobić, aby przekształcić zmienną w rozkład normalny?
Czy istnieje taka formuła? Biorąc pod uwagę zestaw danych, dla których znana jest lub można zmierzyć średnią, wariancję, skośność i kurtozę, czy istnieje jeden wzór, który można zastosować do obliczenia gęstości prawdopodobieństwa wartości, którą zakłada się na podstawie wyżej wymienionych danych?
Mam pytanie: jak myślisz, jak wygląda rozkład czasu spędzanego dziennie na YouTube? Moja odpowiedź jest taka, że prawdopodobnie jest on zwykle rozłożony i mocno zniekształcony. Oczekuję, że istnieje jeden tryb, w którym większość użytkowników spędza średnio jakiś czas, a następnie długi prawy ogon, ponieważ niektórzy użytkownicy są przytłaczającymi użytkownikami zaawansowanymi. …
Zastosowane liniowe modele statystyczne Kutnera i in. stwierdza, co do odstępstw od założenia normalności modeli ANOVA: Kurtoza rozkładu błędów (mniej lub bardziej pikowany niż rozkład normalny) jest ważniejsza niż skośność rozkładu pod względem wpływu na wnioskowanie . Jestem nieco zdziwiony tym stwierdzeniem i nie udało mi się znaleźć żadnych powiązanych …
Zazwyczaj, gdy napotyka się ciągłe, ale wypaczone miary wyniku w układzie podłużnym (powiedzmy, z jednym efektem między podmiotami), powszechnym podejściem jest przekształcenie wyniku w normalność. Jeśli sytuacja jest ekstremalna, na przykład w przypadku skróconych obserwacji, można się zachwycić i zastosować model krzywej wzrostu Tobita lub coś takiego. Ale jestem zagubiony, …
Chcę wiedzieć, jaki jest zakres wartości skośności i kurtozy, dla których dane są uważane za normalnie rozłożone. Przeczytałem wiele argumentów i przeważnie miałem pomieszane odpowiedzi. Niektórzy mówią, że skośność i dla kurtozy jest dopuszczalnym zakresem normalnego rozkładu. Niektórzy mówią że skośność jest dopuszczalnym zakresem. Znalazłem tutaj szczegółową dyskusję: Jaki jest …
Chciałbym opisać „szczytowość” i „ciężar” ogona kilku wypaczonych funkcji gęstości prawdopodobieństwa. Czy chciałbym opisać cechy, które nazywają „kurtozą”? Czy widziałem tylko słowo „kurtoza” używane w symetrycznych rozkładach?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.