Statystyki i duże zbiory danych data-transformation

4

Pracuję nad projektem, który obejmuje odczytywanie tagów RFID i porównywanie siły sygnału, którą widzi czytnik po zmianie konfiguracji anteny (liczba anteny, pozycja itp.). W ramach projektu muszę porównać konfiguracje, aby zobaczyć, które są najbardziej skuteczne. Idealnie, byłbym w stanie wykonać albo Niesparowany test t lub ANOVA między dwiema pozycjami anteny …

11 data-transformation linear-model descriptive-statistics

2

Test Bartletta vs test Levene'a

Obecnie próbuję zaradzić naruszeniom założeń ANOVA. Użyłem Shapiro-Wilka, aby przetestować normalność, i bawiłem się zarówno testem Levene'a, jak i testem równości wariancji Bartletta. Od tego czasu log przekształciłem moje dane, aby spróbować naprawić nierówne wariancje. Zmieniłem test Bartletta na dane przekształcone w dzienniku i nadal otrzymałem znaczną wartość p, a …

11 anova data-transformation heteroscedasticity levenes-test

1

Porównaj dopasowania modelu z transformowaną i nietransformowaną odpowiedzią

Chcę porównać dane proporcjonalne do trzech różnych grup, np .: ID Group Prop.Nitrogen 1 A 0.89 2 A 0.85 3 B 0.92 4 B 0.97 Po Wharton i Hui (doi: 10.1890 / 10-0340.1 1 ) Myślałem, że lepiej byłoby, gdyby te dane były lepiej przetwarzane za pomocą transformacji logit. Kiedy …

11 data-transformation aic fitting

3

Czy te formuły do przekształcania P, LSD, MSD, HSD, CI do SE jako dokładne lub zawyżone / zachowawcze oszacowanie prawidłowe?

tło Przeprowadzam metaanalizę, która obejmuje wcześniej opublikowane dane. Często różnice między terapiami są zgłaszane z wartościami P, różnicami najmniej znaczącymi (LSD) i innymi statystykami, ale nie zapewniają bezpośredniego oszacowania wariancji. W kontekście modelu, którego używam, przeszacowanie wariancji jest w porządku. Problem Oto lista transformacji do której (Saville 2003), które rozważam, …

11 multiple-comparisons variance data-transformation meta-analysis

3

Transformacja zmieniająca pochylenie bez wpływu na kurtozę?

Jestem ciekawy, czy istnieje transformacja, która zmienia pochylenie zmiennej losowej bez wpływu na kurtozę. Byłoby to analogiczne do tego, jak afiniczna transformacja RV wpływa na średnią i wariancję, ale nie na pochylenie i kurtozę (częściowo dlatego, że pochylenie i kurtoza są zdefiniowane jako niezmienne dla zmian skali). Czy to znany …

11 data-transformation random-variable moments

1

Odwrócone przedziały ufności

Po tym spotkaniu zadaję pytanie o przekształcone wstecz konwencje dotyczące przedziałów ufności. Zgodnie z tym artykułem nominalny CI transformowany wstecznie CI dla średniej logarytmicznej zmiennej losowej wynosi: LCL(X)=exp(Y+var(Y) UdoL ( X) = exp( Y+ var ( Y)2)+ zvar ( Y)n+ var ( Y)2)2 ( n - 1 )------------√) UdoL.(X)=exp⁡(Y+var(Y)2)+zvar(Y)n+var(Y)2)2)(n-1))\ UCL(X)= …

11 confidence-interval data-transformation back-transformation

1

Radzenie sobie z regresją niezwykle ograniczonej zmiennej odpowiedzi

Próbuję modelować zmienną odpowiedzi, która teoretycznie jest ograniczona między -225 a +225. Zmienna to łączny wynik uzyskany przez badanych podczas gry. Chociaż teoretycznie możliwe jest zdobycie przez uczestników +225 punktów. Pomimo tego, ponieważ wynik zależał nie tylko od działań podmiotów, ale także działań innych działań, maksymalna liczba zdobytych punktów wyniosła …

11 regression data-transformation beta-distribution bounds beta-regression

2

Przekształć zmienne ciągłe dla regresji logistycznej

Mam duże dane ankietowe, binarną zmienną wyniku i wiele zmiennych objaśniających, w tym binarną i ciągłą. Buduję zestawy modeli (eksperymentuję zarówno z GLM, jak i mieszanym GLM) i wykorzystuję podejścia teoretyczne do wyboru najlepszego modelu. Dokładnie przeanalizowałem wyjaśnienia (zarówno ciągłe, jak i kategoryczne) pod kątem korelacji i używam tylko tych …

11 regression logistic data-transformation skewness

2

Problem z konwersją ze współczynnika na zmienną numeryczną w R [zamknięty]

Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 7 lat temu . Chciałbym przekonwertować zmienną czynnikową na zmienną numeryczną, ale as.numericnie daje oczekiwanego efektu. Poniżej otrzymuję statystyki podsumowujące dla numerycznej wersji zmiennej na …

11 r data-transformation

2

Grupowanie bardzo wypaczonych, zliczanie danych: jakieś sugestie (transformacja itp.)?

Podstawowy problem Oto mój podstawowy problem: próbuję zgrupować zestaw danych zawierający niektóre bardzo wypaczone zmienne z licznikami. Zmienne zawierają wiele zer i dlatego nie są zbyt pouczające dla mojej procedury klastrowania - która prawdopodobnie jest algorytmem k-średnich. Dobra, mówisz, po prostu przekształć zmienne za pomocą pierwiastka kwadratowego, pola Coxa lub …

11 clustering data-transformation k-means count-data compositional-data

4

Dlaczego nie przekształcić logów wszystkich zmiennych, które nie są głównym przedmiotem zainteresowania?

Książki i dyskusje często stwierdzają, że w obliczu problemów (których jest kilka) za pomocą predyktora, transformacja logów jest możliwa. Rozumiem teraz, że zależy to od rozkładów, a normalność w predyktorach nie jest założeniem regresji; ale transformacja dziennika sprawia, że dane są bardziej jednolite, mniej zależne od wartości odstających i tak …

10 regression data-transformation

2

Regresja z odwrotną zmienną niezależną

Załóżmy, że mam wektor zmiennych zależnych i wektor zmiennej niezależnej. Kiedy jest wykreślane względem , widzę, że istnieje między nimi zależność liniowa (trend wzrostowy). Teraz, to oznacza również, że istnieje liniowa tendencja spadkowa między i .T N X T 1N.NNYYYN.NNXXXYYY YX1X1X\frac{1}{X}YYYXXX Teraz, jeśli uruchomię regresję: i uzyskam dopasowaną wartośćY = …

10 regression data-transformation linear-model

3

W jaki sposób zmiana wagi danych z różnorodności w American Community Survey wpłynie na margines błędu?

Kontekst: Moja organizacja obecnie porównuje statystyki dotyczące różnorodności siły roboczej (np.% Osób niepełnosprawnych,% kobiet,% weteranów) z całkowitą dostępnością siły roboczej dla tych grup na podstawie American Community Survey (projekt ankietowy przeprowadzony przez US Census Bureau). Jest to niedokładny punkt odniesienia, ponieważ mamy bardzo konkretny zestaw miejsc pracy, które mają inne …

10 confidence-interval sampling data-transformation diversity

1

Jak włączyć innowacyjną wartość odstającą przy obserwacji 48 w moim modelu ARIMA?

Pracuję nad zestawem danych. Po zastosowaniu niektórych technik identyfikacji modelu, wyszłam z modelem ARIMA (0,2,1). Użyłem detectIOfunkcji w pakiecie TSAw R do wykrycia innowacyjnej wartości odstającej (IO) przy 48. obserwacji mojego oryginalnego zestawu danych. Jak włączyć tę wartość odstającą do mojego modelu, aby móc jej używać do celów prognozowania? Nie …

10 r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

1

Rejestrowałem zmienną zależną, czy mogę używać rozkładu normalnego GLM z funkcją linku LOG?

Mam pytanie dotyczące uogólnionych modeli liniowych (GLM). Moja zmienna zależna (DV) jest ciągła i nie jest normalna. Więc logowałem to przekształciłem (wciąż nie jest normalne, ale poprawiłem). Chcę powiązać DV z dwiema zmiennymi kategorialnymi i jedną ciągłą zmienną zmienną. W tym celu chcę przeprowadzić GLM (używam SPSS), ale nie jestem …

10 normal-distribution generalized-linear-model data-transformation residuals histogram

Pytania otagowane jako data-transformation