Pytania otagowane jako data-transformation

Ponowne wyrażanie matematyczne, często nieliniowe, wartości danych. Dane są często przekształcane w celu spełnienia założeń modelu statystycznego lub w celu ułatwienia interpretacji wyników analizy.

4
Używanie decybeli w statystyce
Pracuję nad projektem, który obejmuje odczytywanie tagów RFID i porównywanie siły sygnału, którą widzi czytnik po zmianie konfiguracji anteny (liczba anteny, pozycja itp.). W ramach projektu muszę porównać konfiguracje, aby zobaczyć, które są najbardziej skuteczne. Idealnie, byłbym w stanie wykonać albo Niesparowany test t lub ANOVA między dwiema pozycjami anteny …

2
Test Bartletta vs test Levene'a
Obecnie próbuję zaradzić naruszeniom założeń ANOVA. Użyłem Shapiro-Wilka, aby przetestować normalność, i bawiłem się zarówno testem Levene'a, jak i testem równości wariancji Bartletta. Od tego czasu log przekształciłem moje dane, aby spróbować naprawić nierówne wariancje. Zmieniłem test Bartletta na dane przekształcone w dzienniku i nadal otrzymałem znaczną wartość p, a …


3
Czy te formuły do ​​przekształcania P, LSD, MSD, HSD, CI do SE jako dokładne lub zawyżone / zachowawcze oszacowanie prawidłowe?
tło Przeprowadzam metaanalizę, która obejmuje wcześniej opublikowane dane. Często różnice między terapiami są zgłaszane z wartościami P, różnicami najmniej znaczącymi (LSD) i innymi statystykami, ale nie zapewniają bezpośredniego oszacowania wariancji. W kontekście modelu, którego używam, przeszacowanie wariancji jest w porządku. Problem Oto lista transformacji do której (Saville 2003), które rozważam, …


1
Odwrócone przedziały ufności
Po tym spotkaniu zadaję pytanie o przekształcone wstecz konwencje dotyczące przedziałów ufności. Zgodnie z tym artykułem nominalny CI transformowany wstecznie CI dla średniej logarytmicznej zmiennej losowej wynosi: LCL(X)=exp(Y+var(Y) UdoL ( X) = exp( Y+ var ( Y)2)+ zvar ( Y)n+ var ( Y)2)2 ( n - 1 )------------√) UdoL.(X)=exp⁡(Y+var(Y)2)+zvar(Y)n+var(Y)2)2)(n-1))\ UCL(X)= …

1
Radzenie sobie z regresją niezwykle ograniczonej zmiennej odpowiedzi
Próbuję modelować zmienną odpowiedzi, która teoretycznie jest ograniczona między -225 a +225. Zmienna to łączny wynik uzyskany przez badanych podczas gry. Chociaż teoretycznie możliwe jest zdobycie przez uczestników +225 punktów. Pomimo tego, ponieważ wynik zależał nie tylko od działań podmiotów, ale także działań innych działań, maksymalna liczba zdobytych punktów wyniosła …

2
Przekształć zmienne ciągłe dla regresji logistycznej
Mam duże dane ankietowe, binarną zmienną wyniku i wiele zmiennych objaśniających, w tym binarną i ciągłą. Buduję zestawy modeli (eksperymentuję zarówno z GLM, jak i mieszanym GLM) i wykorzystuję podejścia teoretyczne do wyboru najlepszego modelu. Dokładnie przeanalizowałem wyjaśnienia (zarówno ciągłe, jak i kategoryczne) pod kątem korelacji i używam tylko tych …

2
Problem z konwersją ze współczynnika na zmienną numeryczną w R [zamknięty]
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 7 lat temu . Chciałbym przekonwertować zmienną czynnikową na zmienną numeryczną, ale as.numericnie daje oczekiwanego efektu. Poniżej otrzymuję statystyki podsumowujące dla numerycznej wersji zmiennej na …

2
Grupowanie bardzo wypaczonych, zliczanie danych: jakieś sugestie (transformacja itp.)?
Podstawowy problem Oto mój podstawowy problem: próbuję zgrupować zestaw danych zawierający niektóre bardzo wypaczone zmienne z licznikami. Zmienne zawierają wiele zer i dlatego nie są zbyt pouczające dla mojej procedury klastrowania - która prawdopodobnie jest algorytmem k-średnich. Dobra, mówisz, po prostu przekształć zmienne za pomocą pierwiastka kwadratowego, pola Coxa lub …

4
Dlaczego nie przekształcić logów wszystkich zmiennych, które nie są głównym przedmiotem zainteresowania?
Książki i dyskusje często stwierdzają, że w obliczu problemów (których jest kilka) za pomocą predyktora, transformacja logów jest możliwa. Rozumiem teraz, że zależy to od rozkładów, a normalność w predyktorach nie jest założeniem regresji; ale transformacja dziennika sprawia, że ​​dane są bardziej jednolite, mniej zależne od wartości odstających i tak …

2
Regresja z odwrotną zmienną niezależną
Załóżmy, że mam wektor zmiennych zależnych i wektor zmiennej niezależnej. Kiedy jest wykreślane względem , widzę, że istnieje między nimi zależność liniowa (trend wzrostowy). Teraz, to oznacza również, że istnieje liniowa tendencja spadkowa między i .T N X T 1N.NNYYYN.NNXXXYYY YX1X1X\frac{1}{X}YYYXXX Teraz, jeśli uruchomię regresję: i uzyskam dopasowaną wartośćY = …

3
W jaki sposób zmiana wagi danych z różnorodności w American Community Survey wpłynie na margines błędu?
Kontekst: Moja organizacja obecnie porównuje statystyki dotyczące różnorodności siły roboczej (np.% Osób niepełnosprawnych,% kobiet,% weteranów) z całkowitą dostępnością siły roboczej dla tych grup na podstawie American Community Survey (projekt ankietowy przeprowadzony przez US Census Bureau). Jest to niedokładny punkt odniesienia, ponieważ mamy bardzo konkretny zestaw miejsc pracy, które mają inne …

1
Jak włączyć innowacyjną wartość odstającą przy obserwacji 48 w moim modelu ARIMA?
Pracuję nad zestawem danych. Po zastosowaniu niektórych technik identyfikacji modelu, wyszłam z modelem ARIMA (0,2,1). Użyłem detectIOfunkcji w pakiecie TSAw R do wykrycia innowacyjnej wartości odstającej (IO) przy 48. obserwacji mojego oryginalnego zestawu danych. Jak włączyć tę wartość odstającą do mojego modelu, aby móc jej używać do celów prognozowania? Nie …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Rejestrowałem zmienną zależną, czy mogę używać rozkładu normalnego GLM z funkcją linku LOG?
Mam pytanie dotyczące uogólnionych modeli liniowych (GLM). Moja zmienna zależna (DV) jest ciągła i nie jest normalna. Więc logowałem to przekształciłem (wciąż nie jest normalne, ale poprawiłem). Chcę powiązać DV z dwiema zmiennymi kategorialnymi i jedną ciągłą zmienną zmienną. W tym celu chcę przeprowadzić GLM (używam SPSS), ale nie jestem …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.