Czytałem w kółko, że walidacja krzyżowa „Leave-one-out-out” ma dużą wariancję ze względu na duże nakładanie się fałdów treningowych. Nie rozumiem jednak, dlaczego tak jest: czy wydajność walidacji krzyżowej nie powinna być bardzo stabilna (niska wariancja) właśnie dlatego, że zestawy treningowe są prawie identyczne? Czy też źle rozumiem pojęcie „wariancji”?
Nie rozumiem też w pełni, w jaki sposób LOO może być bezstronny, ale mam dużą wariancję? Jeśli szacunek LOO jest równy rzeczywistej wartości estymatora w oczekiwanej długości - w jaki sposób może on mieć dużą wariancję?
Uwaga: Wiem, że istnieje podobne pytanie: Dlaczego wariancja krzyżowej walidacji (LOOCV) z pominięciem jednego pomysłu dotyczy wysokiego oszacowania błędu? Jednak osoba, która odpowiedziała, mówi później w komentarzach, że pomimo pozytywnych opinii zdał sobie sprawę, że jego odpowiedź jest błędna.