Ponowne wyrażanie matematyczne, często nieliniowe, wartości danych. Dane są często przekształcane w celu spełnienia założeń modelu statystycznego lub w celu ułatwienia interpretacji wyników analizy.
Możesz mieć dane w formacie szerokim lub długim. Jest to dość ważna rzecz, ponieważ możliwe do zastosowania metody różnią się w zależności od formatu. Wiem, że musisz pracować z pakietem przekształcania melt()i cast()z niego, ale wydaje się, że niektóre rzeczy nie dostaję. Czy ktoś może dać mi krótki przegląd tego, …
Powiedzmy na przykład, że robisz model liniowy, ale dane są złożone.yyy y=xβ+ϵy=xβ+ϵ y = x \beta + \epsilon Mój zestaw danych jest złożony, ponieważ we wszystkich liczbach mają postać . Czy jest coś proceduralnie odmiennego podczas pracy z takimi danymi?yyy(a+bi)(a+bi)(a + bi) Pytam, bo skończysz na otrzymywaniu złożonych macierzy kowariancji …
Pracuję z dużym zestawem danych (poufnym, więc nie mogę udostępniać zbyt wiele) i doszedłem do wniosku, że konieczna będzie regresja dwumianowa. Nigdy wcześniej nie dokonywałem regresji glm i nie mogę znaleźć żadnych jasnych informacji na temat założeń. Czy są takie same dla MLR? Czy mogę przekształcić zmienne w ten sam …
Częstym etapem wstępnego przetwarzania algorytmów uczenia maszynowego jest wybielanie danych. Wydaje się, że zawsze dobrze jest wybielić, ponieważ dekoreluje dane, co ułatwia modelowanie. Kiedy wybielanie nie jest zalecane? Uwaga: mam na myśli dekorelację danych.
Próbuję wykonać regresję wielokrotną w R. Jednak moja zmienna zależna ma następujący wykres: Oto macierz wykresu rozrzutu ze wszystkimi moimi zmiennymi ( WARjest zmienną zależną): Wiem, że muszę wykonać transformację tej zmiennej (i ewentualnie zmiennych niezależnych?), Ale nie jestem pewien dokładnej wymaganej transformacji. Czy ktoś może skierować mnie we właściwym …
Zamknięte. To pytanie jest nie na temat . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby było tematem dotyczącym weryfikacji krzyżowej. Zamknięte 6 lat temu . Chciałbym przeprowadzić kolumnową normalizację macierzy w R. Biorąc pod uwagę macierz m, chcę znormalizować każdą kolumnę dzieląc każdy element przez sumę …
Wcześniej używałem prognozy pro do prognozowania szeregów czasowych na jednym szeregu, ale zmieniam przepływ pracy na R. Pakiet prognozy dla R zawiera wiele przydatnych funkcji, ale jedna rzecz nie robi to jakiejkolwiek transformacji danych przed uruchomieniem auto .arima (). W niektórych przypadkach prognozy pro decydują się na rejestrowanie danych transformacji …
Moja zmienna zależna pokazana poniżej nie pasuje do żadnej znanej mi dystrybucji. Regresja liniowa wytwarza nieco nienormalne, wypaczone w prawo resztki, które w dziwny sposób odnoszą się do przewidywanego Y (drugi wykres). Wszelkie sugestie dotyczące transformacji lub innych sposobów uzyskania najbardziej aktualnych wyników i najlepszej dokładności predykcyjnej? Jeśli to możliwe, …
Rozumiem logikę kodowania do analizy danych. Moje pytanie poniżej dotyczy użycia określonego kodu. Czy istnieje powód, dla którego płeć jest często kodowana jako 0 dla kobiety i 1 dla mężczyzny? Dlaczego to kodowanie jest uważane za „standardowe”? Porównaj to z Kobietą = 1 i Mężczyzną = 2. Czy występuje problem …
Uczenie maszynowe (ML) w znacznym stopniu wykorzystuje techniki regresji liniowej i logistycznej. Powołuje się on także na technikach inżynierii (funkcja feature transform, kernelitp). Dlaczego nic o variable transformation(np power transformation) wymienione w ML? (Na przykład, nigdy nie słyszę o włączeniu roota lub logu do funkcji, zwykle używają po prostu wielomianów …
Szukam zaawansowanego studium przypadku regresji liniowej ilustrującego kroki wymagane do modelowania złożonych, wielu nieliniowych zależności za pomocą GLM lub OLS. Zaskakująco trudno jest znaleźć zasoby wykraczające poza podstawowe przykłady szkolne: większość książek, które przeczytałem, nie pójdzie dalej niż logiczna transformacja odpowiedzi w połączeniu z BoxCox jednego predyktora, lub w najlepszym …
Pracuję nad algorytmem, który opiera się na fakcie, że obserwacje są normalnie rozłożone, i chciałbym empirycznie przetestować odporność algorytmu na to założenie.YYY Aby to zrobić, szukałem sekwencji przemian , które stopniowo zakłócić normalność . Na przykład, jeśli są normalne, mają skośność i kurtozę , i byłoby miło znaleźć sekwencję transformacji, …
Używam czwartej 1/4transformacji mocy root ( ) na mojej zmiennej odpowiedzi, w wyniku heteroscedastyczności. Ale teraz nie jestem pewien, jak interpretować moje współczynniki regresji. Zakładam, że musiałbym przestawić współczynniki na czwartą potęgę podczas transformacji wstecznej (patrz poniżej dane wyjściowe regresji). Wszystkie zmienne wyrażone są w jednostkach dolara w milionach, ale …
Zbudowałem indeks kapitału społecznego za pomocą techniki PCA. Indeks ten zawiera wartości zarówno dodatnie, jak i ujemne. Chcę przekształcić / przekonwertować ten indeks na skalę 0-100, aby ułatwić interpretację. Proszę zasugerować mi najłatwiejszy sposób.
Dostosowanie sezonowe jest kluczowym etapem wstępnego przetwarzania danych do dalszych badań. Badacz ma jednak wiele opcji rozkładu sezonowego w cyklu trendu. Najczęstszymi (sądząc po liczbie cytowań w literaturze empirycznej) rywalizującymi metodami rozkładu sezonowego są X-11 (12) -ARIMA, Tramo / Seats (oba zaimplementowane w Demetra + ) i 's stl . …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.