Statystyki i duże zbiory danych skewness

2

Skośność logarytmu zmiennej losowej gamma

Rozważ losową zmienną gamma . Istnieją zgrabne wzory na średnią, wariancję i skośność:X∼Γ(α,θ)X∼Γ(α,θ)X\sim\Gamma(\alpha, \theta) E[X]Var[X]Skewness[X]=αθ=αθ2=1/α⋅E[X]2=2/α−−√E[X]=αθVar⁡[X]=αθ2=1/α⋅E[X]2Skewness⁡[X]=2/α\begin{align} \mathbb E[X]&=\alpha\theta\\ \operatorname{Var}[X]&=\alpha\theta^2=1/\alpha\cdot\mathbb E[X]^2\\ \operatorname{Skewness}[X]&=2/\sqrt{\alpha} \end{align} Rozważmy teraz zmienną losową przekształconą logarytmicznie . Wikipedia podaje wzory na średnią i wariancję:Y=log(X)Y=log⁡(X)Y=\log(X) E[Y]Var[Y]=ψ(α)+log(θ)=ψ1(α)E[Y]=ψ(α)+log⁡(θ)Var⁡[Y]=ψ1(α)\begin{align} \mathbb E[Y]&=\psi(\alpha)+\log(\theta)\\ \operatorname{Var}[Y]&=\psi_1(\alpha)\\ \end{align} poprzez funkcje digamma i trigamma, które są zdefiniowane jako pierwsza …

16 gamma-distribution skewness logarithm

7

Dlaczego zniekształcone dane nie są preferowane do modelowania?

W większości przypadków, gdy ludzie mówią o transformacjach zmiennych (zarówno dla zmiennych predykcyjnych, jak i zmiennych odpowiedzi), dyskutują o sposobach leczenia skośności danych (takich jak transformacja logów, transformacja box i Cox itp.). Nie jestem w stanie zrozumieć, dlaczego usuwanie skośności jest uważane za tak powszechną najlepszą praktykę? W jaki sposób …

16 modeling skewness

1

Czy powinienem używać testu t na mocno wypaczonych danych? Dowód naukowy, proszę?

Mam próbki z mocno wypaczonego (wyglądającego jak rozkład wykładniczy) zestawu danych o udziale użytkowników (np. Liczba postów), które mają różne rozmiary (ale nie mniej niż 200) i chcę porównać ich średnią. W tym celu używam dwóch prób niesparowanych testów t (i testów t ze współczynnikiem Welcha, gdy próbki miały różne …

15 hypothesis-testing t-test nonparametric mean skewness

5

Metoda generowania skorelowanych nienormalnych danych

Chciałbym znaleźć metodę generowania skorelowanych, nienormalnych danych. Idealnie więc jakiś rodzaj rozkładu, który przyjmuje parametr kowariancji (lub korelacji) jako parametr i generuje dane, które ją przybliżają. Ale tutaj jest haczyk: metoda, którą próbuję znaleźć, powinna mieć elastyczność, aby kontrolować również jej wielowymiarową skośność i / lub kurtozę. Znam metodę Fleishmana …

14 multivariate-analysis references random-generation skewness copula

4

Czy należy stosować średnią, gdy dane są wypaczone?

Często wprowadzane teksty statystyki statystycznej odróżniają średnią od mediany (często w kontekście statystyki opisowej i motywując do podsumowania tendencji centralnej za pomocą średniej, mediany i trybu), wyjaśniając, że średnia jest wrażliwa na wartości odstające w danych próbki i / lub do wypaczonych rozkładów populacji, co służy uzasadnieniu twierdzenia, że mediana …

14 mean skewness median winsorizing central-tendency

2

Intuicja na chwilę o środku dystrybucji?

Czy ktoś może podać intuicję, dlaczego wyższe momenty rozkładu prawdopodobieństwa , podobnie jak moment trzeci i czwarty, odpowiadają odpowiednio skośności i kurtozie? W szczególności dlaczego odchylenie dotyczące średniej podniesionej do trzeciej lub czwartej potęgi ostatecznie przekłada się na miarę skośności i kurtozy? Czy istnieje sposób na odniesienie tego do trzeciej …

14 mathematical-statistics skewness moments intuition kurtosis

3

Przekształcanie bardzo wypaczonych rozkładów

Załóżmy, że mam zmienną, której rozkład jest wypaczony w bardzo dużym stopniu pozytywnie, tak że pobranie logu nie będzie wystarczające, aby umieścić go w zakresie skośności dla rozkładu normalnego. Jakie są moje opcje w tym momencie? Co mogę zrobić, aby przekształcić zmienną w rozkład normalny?

13 data-transformation skewness

3

Formuła formy zamkniętej dla funkcji rozkładu obejmującej skośność i kurtozę?

Czy istnieje taka formuła? Biorąc pod uwagę zestaw danych, dla których znana jest lub można zmierzyć średnią, wariancję, skośność i kurtozę, czy istnieje jeden wzór, który można zastosować do obliczenia gęstości prawdopodobieństwa wartości, którą zakłada się na podstawie wyżej wymienionych danych?

13 distributions pdf kurtosis skewness

11

Czy rozkład, który jest normalny, ale mocno wypaczony, jest uważany za gaussowski?

Mam pytanie: jak myślisz, jak wygląda rozkład czasu spędzanego dziennie na YouTube? Moja odpowiedź jest taka, że prawdopodobnie jest on zwykle rozłożony i mocno zniekształcony. Oczekuję, że istnieje jeden tryb, w którym większość użytkowników spędza średnio jakiś czas, a następnie długi prawy ogon, ponieważ niektórzy użytkownicy są przytłaczającymi użytkownikami zaawansowanymi. …

12 distributions normal-distribution skewness skew-normal

2

Odejście od założenia normalności w ANOVA: czy kurtoza lub skośność są ważniejsze?

Zastosowane liniowe modele statystyczne Kutnera i in. stwierdza, co do odstępstw od założenia normalności modeli ANOVA: Kurtoza rozkładu błędów (mniej lub bardziej pikowany niż rozkład normalny) jest ważniejsza niż skośność rozkładu pod względem wpływu na wnioskowanie . Jestem nieco zdziwiony tym stwierdzeniem i nie udało mi się znaleźć żadnych powiązanych …

12 anova normality-assumption skewness kurtosis

2

W danych skośnych po lewej stronie jaki jest związek między średnią a medianą?

Myślę, że mediana ≤≤\leq oznacza. Czy tak jest w przypadku?

12 distributions self-study mean skewness median

2

Co zrobić, gdy niektóre punkty czasowe mają mocno wypaczone odpowiedzi, a niektóre nie w badaniu z powtarzanymi pomiarami?

Zazwyczaj, gdy napotyka się ciągłe, ale wypaczone miary wyniku w układzie podłużnym (powiedzmy, z jednym efektem między podmiotami), powszechnym podejściem jest przekształcenie wyniku w normalność. Jeśli sytuacja jest ekstremalna, na przykład w przypadku skróconych obserwacji, można się zachwycić i zastosować model krzywej wzrostu Tobita lub coś takiego. Ale jestem zagubiony, …

12 repeated-measures data-transformation skewness

1

Dlaczego skośny lewy nazywany jest skośnym ujemnie, a prawy skośny nazywany dodatnim skośnym?

Ciekawi mnie nomenklatura: dlaczego skośne lewe nazywane są skośne ujemnie, a prawe skośne nazywane dodatnie skośne?

12 terminology skewness

3

Zakres wartości skośności i kurtozy dla rozkładu normalnego

Chcę wiedzieć, jaki jest zakres wartości skośności i kurtozy, dla których dane są uważane za normalnie rozłożone. Przeczytałem wiele argumentów i przeważnie miałem pomieszane odpowiedzi. Niektórzy mówią, że skośność i dla kurtozy jest dopuszczalnym zakresem normalnego rozkładu. Niektórzy mówią że skośność jest dopuszczalnym zakresem. Znalazłem tutaj szczegółową dyskusję: Jaki jest …

11 normal-distribution skewness kurtosis

5

„Szczytowość” wypaczonej funkcji gęstości prawdopodobieństwa

Chciałbym opisać „szczytowość” i „ciężar” ogona kilku wypaczonych funkcji gęstości prawdopodobieństwa. Czy chciałbym opisać cechy, które nazywają „kurtozą”? Czy widziałem tylko słowo „kurtoza” używane w symetrycznych rozkładach?

11 pdf descriptive-statistics skewness kurtosis

Pytania otagowane jako skewness