Widziałem wiele miejsc, w których mają zestawy danych wejściowych / wyjściowych, w których najpierw tworzą linię regresji liniowej, korygują odchylenie, a następnie używają tych danych tylko w swoim modelu. Nie dostałem, co to jest korekta błędu?
Widziałem wiele miejsc, w których mają zestawy danych wejściowych / wyjściowych, w których najpierw tworzą linię regresji liniowej, korygują odchylenie, a następnie używają tych danych tylko w swoim modelu. Nie dostałem, co to jest korekta błędu?
Odpowiedzi:
Mimo że opis problemu nie jest wystarczająco precyzyjny, aby dokładnie wiedzieć, do jakiego rodzaju korekty odchylenia masz na myśli, myślę, że mogę o tym mówić w ogólnym ujęciu. Czasami estymator może być stronniczy. Oznacza to jedynie, że chociaż może to być dobry estymator, jego oczekiwana lub średnia wartość nie jest dokładnie równa parametrowi. Różnica między średnią estymatora a rzeczywistą wartością parametru nazywa się odchyleniem. Kiedy wiadomo, że estymator jest tendencyjny, czasem można w inny sposób oszacować błąd, a następnie zmodyfikować estymator poprzez odjęcie szacowanego błędu od pierwotnego oszacowania. Ta procedura nazywa się korekcją uprzedzeń. Odbywa się to z myślą o poprawie oszacowania. Chociaż zmniejszy to stronniczość, zwiększy również wariancję.
Dobrym przykładem udanej korekcji błędu jest oszacowanie korekcji błędu początkowego poziomu błędu klasyfikacji. Oszacowanie stopy błędu przy ponownym podstawieniu ma duże optymistyczne nastawienie, gdy wielkość próby jest niewielka. Bootstrap służy do oszacowania błędu szacunkowego odtworzenia, a ponieważ szacunek ponownego oszacowania nie docenia poziomu błędu, szacunek wstępny jest dodawany do oszacowania ponownego podstawiania, aby uzyskać oszacowany przez błąd szacunkowy błąd początkowy. Gdy wielkość próbki jest mała 30 lub mniej, łącząc obie klasy w problemie dwóch klas, pewne formy oszacowania bootstrap (szczególnie oszacowanie 632) dostarczają dokładniejszych oszacowań poziomów błędów niż pomijalna weryfikacja krzyżowa (co jest bardzo prawie obiektywne oszacowanie poziomu błędu).