Pytania otagowane jako data-transformation

Ponowne wyrażanie matematyczne, często nieliniowe, wartości danych. Dane są często przekształcane w celu spełnienia założeń modelu statystycznego lub w celu ułatwienia interpretacji wyników analizy.


3
Model liniowy Heteroscedastyczność
Mam następujący model liniowy: Aby rozwiązać problem heteroscedastyczności resztek, próbowałem zastosować transformację logu do zmiennej zależnej jako ale nadal widzę ten sam efekt rozłożenia na resztki. Wartości DV są stosunkowo małe, więc stałe dodanie +1 przed pobraniem dziennika prawdopodobnie nie jest w tym przypadku właściwe.log( Y+ 1 )log⁡(Y+1)\log(Y + 1) …

4
Jak interpretować współczynniki przekształcone logarytmicznie w regresji liniowej?
Moja sytuacja to: Mam 1 zmienną ciągłą zależną i 1 ciągłą zmienną predykcyjną, którą przekształciłem logarytmicznie, aby znormalizować ich reszty dla prostej regresji liniowej. Byłbym wdzięczny za wszelką pomoc dotyczącą powiązania tych zmienionych zmiennych z ich pierwotnym kontekstem. Chcę użyć regresji liniowej, aby przewidzieć liczbę dni, w których uczniowie opuścili …

1
Kiedy transformować zmienne predykcyjne podczas regresji wielokrotnej?
Obecnie biorę swoją pierwszą stosowaną klasę regresji liniowej na poziomie magisterskim i walczę z transformacjami zmiennych predykcyjnych w wielokrotnej regresji liniowej. Tekst, którego używam, Kutner i in. „Stosowane liniowe modele statystyczne” wydaje się nie obejmować mojego pytania. (oprócz sugerowania, że ​​istnieje metoda Box-Coxa do transformacji wielu predyktorów). W obliczu zmiennej …


5
Jakie inne transformacje normalizujące są powszechnie stosowane poza zwykłymi, takimi jak pierwiastek kwadratowy, log itp.?
W analizie wyników testu (np. W edukacji lub psychologii) powszechne techniki analizy często zakładają, że dane są zwykle dystrybuowane. Jednak być może częściej niż nie, wyniki często odbiegają od normy. Znam kilka podstawowych transformacji normalizujących, takich jak: pierwiastki kwadratowe, logarytmy, odwrotne transformacje do zmniejszania skosu dodatniego, odbite wersje powyższych dla …

1
Dlaczego nie możemy użyć
Wyobraź sobie, że mamy model regresji liniowej ze zmienną zależną yyy. Znajdziemy toR2)yRy2R^2_y. Teraz wykonujemy kolejną regresję, ale tym razemlog( y)log⁡(y)\log(y)i podobnie znajdź R2)log( y)Rlog⁡(y)2R^2_{\log(y)}. Powiedziano mi, że nie mogę porównać obuR2)R2R^2aby zobaczyć, który model jest bardziej odpowiedni. Dlaczego? Podany mi powód był taki, że będziemy porównywać zmienność różnych wielkości …



2
Przekształcanie statystyk zamówień
Załóżmy, że zmienne losowe i są niezależne i przez . Pokaż, że ma \ dystrybucja tekstu {Exp} (1) .X1,...,XnX1,...,XnX_1, ... , X_nY1,...,YnY1,...,YnY_1, ..., Y_nU(0,a)U(0,a)U(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Zn=nlog⁡max(Y(n),X(n))min(Y(n),X(n))Z_n= n\log\frac{\max(Y_{(n)},X_{(n)})}{\min(Y_{(n)},X_{(n)})}Exp(1)Exp(1)\text{Exp}(1) Zacząłem ten problem, ustawiając {X1,...,Xn,Y1,...Yn}={Z1,...,Zn}{X1,...,Xn,Y1,...Yn}={Z1,...,Zn}\{X_1,...,X_n,Y_1,...Y_n\} = \{Z_1,...,Z_n\} Następnie max(Yn,Xn)=Z(2n)max(Yn,Xn)=Z(2n)\max(Y_n,X_n)= Z_{(2n)} będzie rozpowszechniany jako (za)2n(za)2n(\frac{z}{a})^{2n} a min(Yn,Xn)=Z(1)min(Yn,Xn)=Z(1)\min(Y_n,X_n)= Z_{(1)} będzie dystrybuowany jako 1−(1−za)2n1−(1−za)2n1 - (1 - \frac{z}{a})^{2n} …

2
Wyniki regresji mają nieoczekiwany górny limit
Próbuję przewidzieć wynik równowagi i wypróbowałem kilka różnych metod regresji. Zauważyłem jedną rzecz, że przewidywane wartości wydają się mieć pewien górny limit. To znaczy, faktyczny bilans wynosi , ale moje przewidywania sięgają około . Poniższy wykres pokazuje rzeczywistą vs przewidywaną równowagę (przewidywaną za pomocą regresji liniowej):[ 0,0 , 1,0 )[0,0,1.0)[0.0, …

1
Standaryzacja funkcji podczas korzystania z LDA jako etapu wstępnego przetwarzania
Jeśli do redukcji wymiarowości (lub transformacji po zmniejszeniu wymiarowości za pomocą PCA) stosuje się wieloklasową liniową analizę dyskryminacyjną (lub czasami czytam też analizę wielokrotnej dyskryminacji), rozumiem, że ogólnie „normalizacja Z-score” (lub standaryzacja) funkcje nie będą konieczne, nawet jeśli są mierzone w zupełnie innych skalach, prawda? Skoro LDA zawiera termin podobny …

2
Pomóż mi dopasować tę nieliniową regresję wielokrotną, która oparła się wszystkim poprzednim wysiłkom
EDYCJA: Od czasu opublikowania tego posta śledzę tutaj dodatkowy post . Podsumowanie poniższego tekstu: Pracuję nad modelem i próbowałem regresji liniowej, transformacji Boxa Coxa i GAM, ale nie zrobiłem dużego postępu Korzystając z tej opcji R, pracuję obecnie nad modelem do przewidywania sukcesu mniejszych graczy baseballowych na poziomie ligi głównej …

1
Znajdowanie rozkładu statystyki
Studiowanie do testu. Nie mogłem odpowiedzieć na to. Niech będzie iid zmiennych losowych. DefiniowaćX1 , ja,X2 , ja,X3 , ja, i = 1 , … , nX1,i,X2,i,X3,i,i=1,…,nX_{1,i},X_{2,i},X_{3,i}, i=1,\ldots,nN.( 0 , 1 )N(0,1)\mathcal{N}(0,1) W.ja= (X1 , ja+X2 , jaX3 , ja) /1 +X2)3 , ja-------√, i = 1 , … , …

4
Box Cox Transforms do regresji
Próbuję dopasować model liniowy do niektórych danych za pomocą tylko jednego predyktora (powiedzmy (x, y)). Dane są takie, że dla małych wartości x wartości y ściśle dopasowują się do linii prostej, jednak wraz ze wzrostem wartości x wartości y stają się bardziej zmienne. Oto przykład takich danych (kod R) y …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.