Dlaczego w workowaniu wykorzystuje się próbki bootstrapu?


10

Bagging to proces tworzenia N uczniów na N różnych próbkach ładowania początkowego, a następnie uwzględnianie ich prognoz.

Moje pytanie brzmi: dlaczego nie zastosować innego rodzaju próbkowania? Dlaczego warto korzystać z próbek bootstrap?

Odpowiedzi:


9

Interesujące pytanie. Pasek startowy ma dobre właściwości próbkowania w porównaniu do niektórych alternatyw, takich jak scyzoryk. Główną wadą ładowania początkowego jest to, że każda iteracja musi pracować z próbką, która jest tak duża jak oryginalny zestaw danych (który może być kosztownie obliczeniowy), podczas gdy niektóre inne techniki próbkowania mogą działać z dużo mniejszymi próbkami.

Ten artykuł sugeruje, że naiwne zmniejszenie wielkości próbki może zmniejszyć wydajność w stosunku do workowania opartego na bootstrapie, co byłoby powodem, aby tego nie robić. W pracy przedstawiono także nowatorską metodę stosowania mniejszych próbek w oszacowaniach workowych, unikając tych problemów.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.