Odpowiedź brzmi: nie , ponieważ błąd i wariancja są atrybutami parametrów modelu, a nie danymi wykorzystywanymi do ich oszacowania. Istnieje częściowy wyjątek od tego stwierdzenia, który dotyczy zmienności stronniczości i zmienności (ha!) W przestrzeni predyktora; więcej na ten temat poniżej. Zauważ, że nie ma to absolutnie nic wspólnego ze znajomością jakiejś „prawdziwej” funkcji dotyczącej predyktorów i zmiennych odpowiedzi.
Rozważ oszacowanie w regresji liniowej, , gdzie jest macierzą predyktorów, jest oszacowań parametrów, a jest wektorem odpowiedzi . Załóżmy dla argumentu, że mamy nieskończoną populację danych, z których można czerpać (nawiasem mówiąc, nie jest to całkowicie śmieszne - gdybyśmy aktywnie rejestrowali dane z jakiegoś fizycznego procesu, moglibyśmy szybko rejestrować dane predykcyjne i odpowiedzi , co praktycznie spełnia to założenie). Rysujemy więc obserwacji, z których każda składa się z jednej wartości odpowiedzi i wartości dla każdej zββ^= (XT.X)- 1XT.YXN.× Pβ^P.× 1YN.× 1N.P.PredyktoryNastępnie obliczamy nasze oszacowanie i rejestrujemy wartości. Weźmy zatem cały ten proces i powtórzmy to razy, za każdym razem czyniąc niezależnym losowaniem z populacji. Będziemy gromadzić szacunki nad którymi możemy obliczyć wariancję każdego elementu w wektorze parametrów. Należy zauważyć, że wariancja tych oszacowań parametrów jest odwrotnie proporcjonalna do i proporcjonalna do , zakładając ortogonalność predyktorów.β^N.i t e rN.N.i t e rβ^N.P.
Odchylenie każdego parametru można oszacować podobnie. Chociaż możemy nie mieć dostępu do funkcji „true”, załóżmy, że możemy wykonać dowolną dużą liczbę losowań z populacji w celu obliczenia , która posłuży jako proxy dla wartości parametru „true” . Zakładamy, że jest to bezstronna ocena (zwykłe najmniejsze kwadraty) i że liczba zastosowanych obserwacji była wystarczająco duża, tak że wariancja tej oceny jest znikoma. Dla każdego z parametrów obliczamy , gdzie wynosi od do . Średnią z tych różnic traktujemy jako oszacowanie odchylenia w odpowiednim parametrze.β^b e s tP.β^b e stjot-β^jotjot1N.i t e r
Istnieją odpowiednie sposoby powiązania stronniczości i wariancji z danymi, ale są one nieco bardziej skomplikowane. Jak widać, odchylenie i wariancję można oszacować dla modeli liniowych, ale będziesz potrzebować sporo danych powstrzymujących. Bardziej podstępnym problemem jest fakt, że kiedy zaczniesz pracować ze stałym zestawem danych, twoje analizy zostaną zanieczyszczone osobistą wariancją, ponieważ już zacząłeś wędrować przez ogród ścieżek rozwidlenia i nie ma sposobu, aby wiedzieć, jak to powielą się poza próbą (chyba że wymyśliłeś tylko jeden model i przeprowadziłeś tę analizę i postanowiłeś pozostawić ją w spokoju po tym).
Jeśli chodzi o same punkty danych, najbardziej poprawną (i trywialną) odpowiedzią jest to, że jeśli istnieje jakakolwiek różnica między aYY^, potrzebujesz bardziej złożonego modelu (zakładając, że możesz poprawnie zidentyfikować wszystkie odpowiednie predyktory; nie możesz). Bez wchodzenia w nudny traktat o filozoficznej naturze „błędu”, sedno sprawy jest takie, że działo się coś, co spowodowało, że Twój model stracił swój ślad. Problem polega na tym, że dodanie złożoności zwiększa wariancję, co prawdopodobnie spowoduje, że nie będzie ona oznaczona w innych punktach danych. Dlatego obawa przed przypisaniem błędu na poziomie pojedynczego punktu danych raczej nie będzie owocnym przedsięwzięciem. Wyjątek (wspomniany w pierwszym akapicie) wynika z faktu, że odchylenie i wariancja są w rzeczywistości funkcjami samych predyktorów, więc możesz mieć duże odchylenie w jednej części przestrzeni predyktora, a mniejsze odchylenie w innej (to samo dla wariancji).Y-Y^wielokrotnie (gdzie i nie została oszacowana na podstawie ) i wykreślania nastawienie (średni) i zmienność w zależności od wartości . Myślę jednak, że to dość wyspecjalizowany problem.Y^= Xβ^β^ YX