Różnica między oczekiwaną wartością estymatora parametru a prawdziwą wartością parametru. NIE używaj tego znacznika w odniesieniu do [bias-term] / [bias-node] (tj. [Przechwycenie]).
CrossValidated ma kilka pytań na temat tego, kiedy i jak zastosować korektę błędu rzadkich zdarzeń autorstwa Kinga i Zenga (2001) . Szukam czegoś innego: minimalnej demonstracji opartej na symulacji, że istnieje uprzedzenie. W szczególności państwo King i Zeng „... w danych dotyczących rzadkich zdarzeń tendencje w prawdopodobieństwach mogą mieć istotne …
Kiedy słowo „uprzedzenie” ukuto w znaczeniu „ ?E [ θ^- θ ]E[θ^−θ]\mathbb{E}[\hat{\theta}-\theta] Powodem, dla którego teraz o tym myślę, jest to, że przypominam Jaynesa w tekście teorii prawdopodobieństwa , krytykując użycie słowa „stronniczość” użytego do opisania tej formuły i sugerując alternatywę. Z teorii prawdopodobieństwa Jaynesa , sekcja 17.2 „Bezstronni estymatorzy:” …
Pracuję nad projektem Machine Learning z danymi, które są już (w dużym stopniu) stronnicze w wyniku selekcji danych. Załóżmy, że masz zestaw zakodowanych reguł. Jak zbudować model uczenia maszynowego, aby go zastąpić, skoro wszystkie dane, których może użyć, to dane, które zostały już odfiltrowane według tych reguł? Aby to wyjaśnić, …
Cierpię na zaciemnienie. Pokazano mi następujący obraz, aby pokazać kompromis wariancji odchylenia w kontekście regresji liniowej: Widzę, że żaden z dwóch modeli nie jest dobrze dopasowany - „prosty” nie docenia złożoności relacji XY, a „złożony” jest po prostu zbyt duży, zasadniczo ucząc się danych treningowych na pamięć. Jednak całkowicie nie …
Czy możesz podać przykład estymatora MLE średniej stronniczości? Nie szukam przykładu, który ogólnie łamie estymatory MLE, naruszając warunki regularności. Wszystkie przykłady, które widzę w Internecie, odnoszą się do wariancji i nie mogę znaleźć niczego związanego ze średnią. EDYTOWAĆ @MichaelHardy podał przykład, w którym otrzymujemy tendencyjne oszacowanie średniej rozkładu jednolitego przy …
Mam pytanie dotyczące pominiętej zmienności stronniczej w regresji logistycznej i liniowej. Powiedzmy, że pomijam niektóre zmienne z modelu regresji liniowej. Udawaj, że te pominięte zmienne nie są skorelowane ze zmiennymi, które zawarłem w moim modelu. Te pominięte zmienne nie wpływają na współczynniki w moim modelu. Ale w regresji logistycznej właśnie …
Próbuję zrozumieć kompromis wariancji odchylenia, związek między odchyleniem estymatora a odchyleniem modelu oraz związek między wariancją estymatora a wariancją modelu. Doszedłem do tych wniosków: Mamy tendencję do przewyższania danych, gdy zaniedbujemy odchylenie estymatora, to znaczy, gdy staramy się jedynie zminimalizować odchylenie modelu zaniedbując wariancję modelu (innymi słowy, staramy się jedynie …
To pytanie odnosi się do pracy Galit Shmueli „Wyjaśnić lub przewidzieć” . W szczególności w sekcji 1.5 „Wyjaśnianie i przewidywanie są różne” profesor Shmueli pisze: W modelowaniu objaśniającym nacisk kładziony jest na minimalizowanie stronniczości w celu uzyskania jak najdokładniejszej reprezentacji podstawowej teorii. To mnie intrygowało za każdym razem, gdy czytam …
pytania Czy to zależy od tego, czy drzewo jest płytkie czy głębokie? Czy możemy to powiedzieć niezależnie od głębokości / poziomów drzewa? Dlaczego odchylenie jest niskie, a wariancja wysoka? Proszę wyjaśnić intuicyjnie i matematycznie
Podstawowym założeniem stosowania modeli regresji do wnioskowania jest to, że „wszystkie istotne predyktory” zostały uwzględnione w równaniu predykcyjnym. Uzasadnieniem jest to, że nieuwzględnienie ważnego czynnika w świecie rzeczywistym prowadzi do tendencyjnych współczynników, a tym samym do niedokładnych wniosków (tj. Pominiętej zmienności stronniczości). Ale w praktyce badawczej nigdy nie widziałem nikogo, …
Czytałem w kółko, że walidacja krzyżowa „Leave-one-out-out” ma dużą wariancję ze względu na duże nakładanie się fałdów treningowych. Nie rozumiem jednak, dlaczego tak jest: czy wydajność walidacji krzyżowej nie powinna być bardzo stabilna (niska wariancja) właśnie dlatego, że zestawy treningowe są prawie identyczne? Czy też źle rozumiem pojęcie „wariancji”? Nie …
Zawsze staram się uzyskać prawdziwą istotę problemu dotyczącego parametrów przypadkowych. Kilkakrotnie czytałem, że estymatory efektów stałych modeli danych nieliniowych paneli mogą być poważnie tendencyjne z powodu „dobrze znanego” problemu parametrów przypadkowych. Kiedy proszę o jasne wyjaśnienie tego problemu, typowa odpowiedź brzmi: Załóżmy, że dane panelu obejmują N pojedynczych osób w …
Zgodnie z tym samouczkiem na temat głębokiego uczenia się , odchudzanie (regularyzacja) zwykle nie jest stosowane do terminów stronniczości b dlaczego? Jakie jest za tym znaczenie (intuicja)?
θ^θ^\hat\thetaθ∗θ∗\theta^*nnn∥θ^−θ∗∥‖θ^−θ∗‖\lVert\hat\theta-\theta^*\rVertO(1/n−−√)O(1/n)O(1/\sqrt n)∥Eθ^−θ∗∥‖Eθ^−θ∗‖\lVert \mathbb E\hat\theta - \theta^*\rVert∥Eθ^−θ^∥‖Eθ^−θ^‖\lVert \mathbb E\hat\theta - \hat\theta\rVertO(1/n−−√)O(1/n)O(1/\sqrt{n}) Interesują mnie modele, które mają odchylenie, które zmniejsza się szybciej niż O(1/n−−√)O(1/n)O(1/\sqrt n) , ale w którym błąd nie zmniejsza się w tym szybszym tempie, ponieważ odchylenie nadal zmniejsza się jako O(1/n−−√)O(1/n)O(1/\sqrt n) . W szczególności chciałbym poznać warunki wystarczające …
Przyjaciel reprezentuje klienta w postępowaniu odwoławczym, po procesie karnym, w którym wydaje się, że wybór jury był rasistowski. Jury składało się z 30 osób, w 4 grupach rasowych. Prokuratura zastosowała stanowcze wyzwania, aby wyeliminować 10 z tych osób z puli. Liczba ludzi i liczba faktycznych wyzwań w każdej grupie rasowej …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.