Statystyki i duże zbiory danych data-transformation

2

Wyodrębnić punkty danych z ruchomej średniej?

Czy można wyodrębnić punkty danych z ruchomych danych średnich? Innymi słowy, jeśli zestaw danych zawiera tylko proste średnie ruchome z poprzednich 30 punktów, czy można wyodrębnić oryginalne punkty danych? Jeśli tak to jak?

15 data-transformation average point-estimation

2

Kanoniczna analiza korelacji z korelacją rang

Kanoniczna analiza korelacji (CCA) ma na celu maksymalizację zwykłej korelacji iloczynu Pearsona z momentem produktu (tj. Współczynnik korelacji liniowej) kombinacji liniowych dwóch zestawów danych. Rozważmy teraz fakt, że ten współczynnik korelacji mierzy tylko asocjacje liniowe - właśnie dlatego używamy na przykład współczynników korelacji Spearmana- lub Kendall- τ (ranga), które mierzą …

15 multivariate-analysis data-transformation spearman-rho kendall-tau canonical-correlation

5

Jaki może być powód zastosowania transformacji pierwiastka kwadratowego w danych?

Czy istnieje jakiś powód tego, co mogę wymyślić, aby przekształcić dane pierwiastkiem kwadratowym? Chodzi mi o to, że zawsze obserwuję wzrost R ^ 2. Ale to prawdopodobnie tylko z powodu centrowania danych! Każda myśl jest doceniana!

15 regression data-transformation variance-stabilizing

3

CDF podniesiony do władzy?

Jeśli FZFZF_Z jest CDF, wygląda na to, że FZ(z)αFZ(z)αF_Z(z)^\alpha ( α>0α>0\alpha \gt 0 ) również jest CDF. P: Czy to wynik standardowy? P: Czy istnieje dobry sposób na znalezienie funkcji ggg pomocą X≡g(Z)X≡g(Z)X \equiv g(Z) st FX(x)=FZ(z)αFX(x)=FZ(z)αF_X(x) = F_Z(z)^\alpha , gdzie x≡g(z)x≡g(z) x \equiv g(z) Zasadniczo mam w ręku inny …

15 data-transformation cdf quantile-function

1

Przekształć dane w pożądaną średnią i odchylenie standardowe

Szukam metody przekształcenia mojego zestawu danych z jego bieżącej średniej i standardowego odchylenia do docelowej średniej i docelowego standardowego odchylenia. Zasadniczo chcę zmniejszyć / rozszerzyć dyspersję i przeskalować wszystkie liczby do średniej. To nie działa, aby wykonać dwie oddzielne transformacje liniowe, jedną dla odchylenia standardowego, a drugą dla średniej. Jakiej …

15 data-transformation standard-deviation mean

2

Przekształcanie danych: wszystkie zmienne czy tylko niestandardowe?

W odkrywaniu statystyk Andy Fielda za pomocą SPSS stwierdza, że wszystkie zmienne muszą zostać przekształcone. Jednak w publikacji: „Badanie zróżnicowanych przestrzennie zależności między użytkowaniem gruntów a jakością wody przy użyciu regresji ważonej geograficznie I: Projektowanie i ocena modelu” wyraźnie stwierdzają, że transformowane były tylko zmienne niestandardowe. Czy ta analiza jest …

14 normal-distribution data-transformation

1

Jak radzić sobie z kombinacją wejść binarnych i ciągłych w sieciach neuronowych?

Używam pakietu nnet w R, aby spróbować zbudować ANN, aby przewidzieć ceny nieruchomości na mieszkanie (prywatny projekt). Jestem w tym nowy i nie mam doświadczenia w matematyce, więc proszę o kontakt ze mną. Mam zmienne wejściowe, które są zarówno binarne, jak i ciągłe. Na przykład niektóre zmienne binarne, które były …

14 r machine-learning data-transformation neural-networks nnet

3

Jaki jest wpływ zmiennych dychotomizujących?

Jakie informacje są tracone podczas dychotomizacji zmiennych? W jaki sposób dychotomizacja pomaga w analizach?

14 regression data-transformation binary-data

3

Jak modelować podłużne duże zbiory danych?

Tradycyjnie używamy modelu mieszanego do modelowania danych podłużnych, tj. Danych takich jak: id obs age treatment_lvl yield 1 0 11 M 0.2 1 1 11.5 M 0.5 1 2 12 L 0.6 2 0 17 H 1.2 2 1 18 M 0.9 możemy przyjąć losowe przechwytywanie lub nachylenie dla różnych …

14 machine-learning data-transformation random-forest panel-data large-data

1

Jak entropia zależy od lokalizacji i skali?

Entropia ciągłego rozkładu z funkcją gęstości faff określa się jako ujemny z oczekiwaniem log( f) ,log⁡(f),\log(f), a zatem jest równa H.fa= - ∫∞- ∞log( f( x ) ) f( x ) d x .Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. Także, że każdej zmiennej losowej XXX , której rozkład jest gęstości faff …

14 distributions data-transformation entropy

3

centrowanie i skalowanie zmiennych zastępczych

Mam zestaw danych, który zawiera zarówno zmienne jakościowe, jak i zmienne ciągłe. Poradzono mi, aby przekształcić zmienne kategorialne jako zmienne binarne dla każdego poziomu (tj. A_level1: {0,1}, A_level2: {0,1}) - Myślę, że niektórzy nazywają to „zmiennymi obojętnymi”. Mając to na uwadze, czy wprowadzanie w błąd i wyśrodkowanie całego zestawu danych …

13 categorical-data data-transformation centering

3

Przekształcanie bardzo wypaczonych rozkładów

Załóżmy, że mam zmienną, której rozkład jest wypaczony w bardzo dużym stopniu pozytywnie, tak że pobranie logu nie będzie wystarczające, aby umieścić go w zakresie skośności dla rozkładu normalnego. Jakie są moje opcje w tym momencie? Co mogę zrobić, aby przekształcić zmienną w rozkład normalny?

13 data-transformation skewness

4

Odpowiednik Boxplot dla dystrybucji o grubych ogonach?

W przypadku normalnie dystrybuowanych danych wykresy pudełkowe są świetnym sposobem na szybką wizualizację mediany i rozprzestrzeniania się danych, a także obecności jakichkolwiek wartości odstających. Jednak w przypadku bardziej ciężkich rozkładów wiele punktów jest pokazanych jako wartości odstające, ponieważ wartości odstające są zdefiniowane jako znajdujące się poza stałym współczynnikiem IQR, i …

13 r distributions data-visualization data-transformation ggplot2

2

Var (X) jest znany, jak obliczyć Var (1 / X)?

Jeśli mam tylko , jak mogę obliczyć \ mathrm {Var} (\ frac {1} {X}) ?Var(X)Var(X)\mathrm{Var}(X)Var(1X)Var(1X)\mathrm{Var}(\frac{1}{X}) Nie mam żadnych informacji na temat dystrybucji XXX , więc nie można użyć transformacji, albo jakiekolwiek inne metody, które wykorzystują rozkład prawdopodobieństwa XXX .

13 distributions variance data-transformation

3

Jak obliczyć estymator skali Qn Rousseeuw'a i Crouxa (1993) dla dużych próbek?

Niech więc dla bardzo krótkiej próbki, takiej jak , można ją obliczyć od znalezienia statycznego tego rzędu różnicy par: { 1 , 3 , 6 , 2 , 7 , 5 } kQn= Cn. { | Xja- Xjot| ; ja<j }( k )Qn=Cn.{|Xi−Xj|;i<j}(k)Q_n = C_n.\{|X_i-X_j|;i < j\}_{(k)}{ 1 , 3 …

13 data-transformation scales robust optimal-scaling

Pytania otagowane jako data-transformation