Zwykle odnosi się do „standaryzacji z”, która polega na przesunięciu i ponownym skalowaniu danych w celu zapewnienia, że mają zerową średnią i wariancję jednostkową. Możliwe są także inne „standaryzacje”.
W niektórych literaturach czytałem, że regresja z wieloma zmiennymi objaśniającymi, jeśli jest w różnych jednostkach, wymaga standaryzacji. (Standaryzacja polega na odjęciu średniej i podzieleniu przez odchylenie standardowe). W jakich innych przypadkach muszę standaryzować swoje dane? Czy istnieją przypadki, w których powinienem jedynie wyśrodkowywać moje dane (tj. Bez dzielenia przez odchylenie …
W pracy rozmawialiśmy o tym, ponieważ mój szef nigdy nie słyszał o normalizacji. W algebrze liniowej normalizacja wydaje się odnosić do podziału wektora przez jego długość. A w statystykach normalizacja wydaje się odnosić do odejmowania średniej, a następnie dzielonej przez jej SD. Ale wydają się one również zamienne z innymi …
Powszechną dobrą praktyką w uczeniu maszynowym jest normalizacja funkcji lub standaryzacja danych zmiennych predykcyjnych, to znaczy, wyśrodkowanie danych odejmując średnią i normalizując ją dzieląc przez wariancję (lub też odchylenie standardowe). W celu zapewnienia sobie samowystarczalności i dla mojego zrozumienia robimy to, aby osiągnąć dwie główne rzeczy: Unikaj bardzo małych odważników …
Czy jednocześnie przekształcam wszystkie moje dane lub foldery (jeśli zastosowano CV)? na przykład (allData - mean(allData)) / sd(allData) Czy osobno przekształcam skład zestawu i zestaw testowy? na przykład (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Czy też przekształcam skład zestawu i korzystam z obliczeń na zestawie testów? …
Moje pytanie brzmi: czy musimy dopasować zestaw danych, aby upewnić się, że wszystkie zmienne mają tę samą skalę, między [0,1], przed dopasowaniem regresji logistycznej. Formuła jest następująca: xi−min(xi)max(xi)−min(xi)xi−min(xi)max(xi)−min(xi)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Mój zestaw danych ma 2 zmienne, opisują to samo dla dwóch kanałów, ale głośność jest inna. Powiedzmy, że jest to liczba odwiedzin …
Mam 2 proste pytania dotyczące regresji liniowej: Kiedy zaleca się ujednolicenie zmiennych objaśniających? Po przeprowadzeniu oszacowania ze znormalizowanymi wartościami, jak można przewidzieć nowe wartości (jak należy znormalizować nowe wartości)? Niektóre referencje byłyby pomocne.
W przypadku LASSO (i innych procedur wyboru modelu) kluczowe jest przeskalowanie predyktorów. Ogólna rekomendacja śledzę to po prostu użyć 0, 1 średni normalizację standardowego odchylenia dla zmiennych ciągłych. Ale co to ma wspólnego z manekinami? Np. Niektóre zastosowane przykłady z tej samej (doskonałej) szkoły letniej powiązałem z przeskalowaniem zmiennych ciągłych, …
Przeczytałem trzy główne powody standaryzacji zmiennych przed czymś takim jak Lassoregresja: 1) Interpretowalność współczynników. 2) Możliwość uszeregowania znaczenia współczynnika według względnej wielkości oszacowań współczynnika skurczu. 3) Nie ma potrzeby przechwytywania. Ale zastanawiam się nad najważniejszą kwestią. Czy mamy powody sądzić, że standaryzacja poprawiłaby generalizację modelu poza próbą? Nie obchodzi mnie …
Mam pytanie, w którym prosi się o sprawdzenie, czy rozkład jednolity ( Uniform(a,b)Unjafaorm(za,b){\rm Uniform}(a,b) ) jest znormalizowany. Po pierwsze, co to znaczy znormalizować dowolny rozkład? I po drugie, jak przejść do sprawdzenia, czy rozkład jest znormalizowany? Rozumiem, obliczając otrzymujemy znormalizowane dane , ale tutaj prosi się o sprawdzenie, czy rozkład …
Cześć chłopaki, znalazłem jeden lub dwa artykuły, które używają regresji grzbietu (dla danych koszykówki). Zawsze kazano mi ustandaryzować moje zmienne, jeśli prowadziłem regresję grzbietu, ale po prostu kazano mi to zrobić, ponieważ grzbiet był wariantem skali (regresja grzbietu nie była tak naprawdę częścią naszego kursu, więc nasz wykładowca przejrzał ją). …
Ogólnie rzecz biorąc, standaryzuję moje zmienne niezależne w regresjach, aby właściwie porównać współczynniki (w ten sposób mają one te same jednostki: odchylenia standardowe). Jednak w przypadku danych panelowych / podłużnych nie jestem pewien, jak powinienem ustandaryzować swoje dane, zwłaszcza jeśli oszacuję model hierarchiczny. Aby zobaczyć, dlaczego może to być potencjalny …
Rozważ regresję liniową z pewną regularyzacją: Np. Znajdź który minimalizuje | | A x - b | | 2 + λ | | x | | 1xxx||Ax−b||2+λ||x||1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 Zwykle kolumny A są znormalizowane, aby miały średnią zerową i normę jednostkową, podczas gdy jest wyśrodkowany, aby mieć średnią zerową. Chcę …
Moje zmienne wejściowe mają różne wymiary. Niektóre zmienne są dziesiętne, a niektóre setne. Czy konieczne jest wyśrodkowanie (odjęcie średniej) lub skalowanie (podzielenie przez odchylenie standardowe) tych zmiennych wejściowych, aby dane były bezwymiarowe podczas korzystania z losowego lasu?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.