Pytania otagowane jako data-transformation

Ponowne wyrażanie matematyczne, często nieliniowe, wartości danych. Dane są często przekształcane w celu spełnienia założeń modelu statystycznego lub w celu ułatwienia interpretacji wyników analizy.


4
Analiza ze złożonymi danymi, coś innego?
Powiedzmy na przykład, że robisz model liniowy, ale dane są złożone.yyy y=xβ+ϵy=xβ+ϵ y = x \beta + \epsilon Mój zestaw danych jest złożony, ponieważ we wszystkich liczbach mają postać . Czy jest coś proceduralnie odmiennego podczas pracy z takimi danymi?yyy(a+bi)(a+bi)(a + bi) Pytam, bo skończysz na otrzymywaniu złożonych macierzy kowariancji …

2
Jakie są założenia ujemnej regresji dwumianowej?
Pracuję z dużym zestawem danych (poufnym, więc nie mogę udostępniać zbyt wiele) i doszedłem do wniosku, że konieczna będzie regresja dwumianowa. Nigdy wcześniej nie dokonywałem regresji glm i nie mogę znaleźć żadnych jasnych informacji na temat założeń. Czy są takie same dla MLR? Czy mogę przekształcić zmienne w ten sam …

3
Czy wybielanie jest zawsze dobre?
Częstym etapem wstępnego przetwarzania algorytmów uczenia maszynowego jest wybielanie danych. Wydaje się, że zawsze dobrze jest wybielić, ponieważ dekoreluje dane, co ułatwia modelowanie. Kiedy wybielanie nie jest zalecane? Uwaga: mam na myśli dekorelację danych.

2
Transformowanie zmiennych dla regresji wielokrotnej w R.
Próbuję wykonać regresję wielokrotną w R. Jednak moja zmienna zależna ma następujący wykres: Oto macierz wykresu rozrzutu ze wszystkimi moimi zmiennymi ( WARjest zmienną zależną): Wiem, że muszę wykonać transformację tej zmiennej (i ewentualnie zmiennych niezależnych?), Ale nie jestem pewien dokładnej wymaganej transformacji. Czy ktoś może skierować mnie we właściwym …

3
Kolumnowa normalizacja macierzy w R [zamknięty]
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 6 lat temu . Chciałbym przeprowadzić kolumnową normalizację macierzy w R. Biorąc pod uwagę macierz m, chcę znormalizować każdą kolumnę dzieląc każdy element przez sumę …

4
Kiedy logować przekształcać szeregi czasowe przed dopasowaniem modelu ARIMA
Wcześniej używałem prognozy pro do prognozowania szeregów czasowych na jednym szeregu, ale zmieniam przepływ pracy na R. Pakiet prognozy dla R zawiera wiele przydatnych funkcji, ale jedna rzecz nie robi to jakiejkolwiek transformacji danych przed uruchomieniem auto .arima (). W niektórych przypadkach prognozy pro decydują się na rejestrowanie danych transformacji …

3
Jak modelować ten dziwny rozkład (prawie odwrotny J)
Moja zmienna zależna pokazana poniżej nie pasuje do żadnej znanej mi dystrybucji. Regresja liniowa wytwarza nieco nienormalne, wypaczone w prawo resztki, które w dziwny sposób odnoszą się do przewidywanego Y (drugi wykres). Wszelkie sugestie dotyczące transformacji lub innych sposobów uzyskania najbardziej aktualnych wyników i najlepszej dokładności predykcyjnej? Jeśli to możliwe, …


3
Dlaczego transformacji mocy lub logów nie uczy się wiele w uczeniu maszynowym?
Uczenie maszynowe (ML) w znacznym stopniu wykorzystuje techniki regresji liniowej i logistycznej. Powołuje się on także na technikach inżynierii (funkcja feature transform, kernelitp). Dlaczego nic o variable transformation(np power transformation) wymienione w ML? (Na przykład, nigdy nie słyszę o włączeniu roota lub logu do funkcji, zwykle używają po prostu wielomianów …

6
Zaawansowane przykłady modelowania regresji
Szukam zaawansowanego studium przypadku regresji liniowej ilustrującego kroki wymagane do modelowania złożonych, wielu nieliniowych zależności za pomocą GLM lub OLS. Zaskakująco trudno jest znaleźć zasoby wykraczające poza podstawowe przykłady szkolne: większość książek, które przeczytałem, nie pójdzie dalej niż logiczna transformacja odpowiedzi w połączeniu z BoxCox jednego predyktora, lub w najlepszym …

4
Transformacja w celu zwiększenia kurtozy i skośności normalnego rv
Pracuję nad algorytmem, który opiera się na fakcie, że obserwacje są normalnie rozłożone, i chciałbym empirycznie przetestować odporność algorytmu na to założenie.YYY Aby to zrobić, szukałem sekwencji przemian , które stopniowo zakłócić normalność . Na przykład, jeśli są normalne, mają skośność i kurtozę , i byłoby miło znaleźć sekwencję transformacji, …

3
Jak interpretować współczynniki regresji, gdy odpowiedź została przekształcona przez 4. pierwiastek?
Używam czwartej 1/4transformacji mocy root ( ) na mojej zmiennej odpowiedzi, w wyniku heteroscedastyczności. Ale teraz nie jestem pewien, jak interpretować moje współczynniki regresji. Zakładam, że musiałbym przestawić współczynniki na czwartą potęgę podczas transformacji wstecznej (patrz poniżej dane wyjściowe regresji). Wszystkie zmienne wyrażone są w jednostkach dolara w milionach, ale …

6
Zmiana skali zmiennej na 0-100
Zbudowałem indeks kapitału społecznego za pomocą techniki PCA. Indeks ten zawiera wartości zarówno dodatnie, jak i ujemne. Chcę przekształcić / przekonwertować ten indeks na skalę 0-100, aby ułatwić interpretację. Proszę zasugerować mi najłatwiejszy sposób.

2
Wybór metody rozkładu sezonowego
Dostosowanie sezonowe jest kluczowym etapem wstępnego przetwarzania danych do dalszych badań. Badacz ma jednak wiele opcji rozkładu sezonowego w cyklu trendu. Najczęstszymi (sądząc po liczbie cytowań w literaturze empirycznej) rywalizującymi metodami rozkładu sezonowego są X-11 (12) -ARIMA, Tramo / Seats (oba zaimplementowane w Demetra + ) i 's stl . …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.