Bagging to proces tworzenia N uczniów na N różnych próbkach ładowania początkowego, a następnie uwzględnianie ich prognoz.
Moje pytanie brzmi: dlaczego nie zastosować innego rodzaju próbkowania? Dlaczego warto korzystać z próbek bootstrap?
Bagging to proces tworzenia N uczniów na N różnych próbkach ładowania początkowego, a następnie uwzględnianie ich prognoz.
Moje pytanie brzmi: dlaczego nie zastosować innego rodzaju próbkowania? Dlaczego warto korzystać z próbek bootstrap?
Odpowiedzi:
Interesujące pytanie. Pasek startowy ma dobre właściwości próbkowania w porównaniu do niektórych alternatyw, takich jak scyzoryk. Główną wadą ładowania początkowego jest to, że każda iteracja musi pracować z próbką, która jest tak duża jak oryginalny zestaw danych (który może być kosztownie obliczeniowy), podczas gdy niektóre inne techniki próbkowania mogą działać z dużo mniejszymi próbkami.
Ten artykuł sugeruje, że naiwne zmniejszenie wielkości próbki może zmniejszyć wydajność w stosunku do workowania opartego na bootstrapie, co byłoby powodem, aby tego nie robić. W pracy przedstawiono także nowatorską metodę stosowania mniejszych próbek w oszacowaniach workowych, unikając tych problemów.