To pytanie pochodzi od tego, które dotyczy „Reguły .632”. Piszę ze szczególnym uwzględnieniem odpowiedzi / notacji użytkownika user603 w zakresie, w jakim upraszcza to sprawę.
Ta odpowiedź zaczyna się od próbki o wielkości z zamianą, z różnych elementów w kolekcji (wywołaj) it N. Prawdopodobieństwo, że próbka jest różna od określonego elementu N, wynosi wtedyn i t h s i m ( 1 - 1 / n ) .
W tej odpowiedzi wszystkie elementy N mają równe szanse na losowanie.
Moje pytanie brzmi: załóżmy zamiast tego, że w powyższym pytaniu elementy do narysowania są takie, że są normalnie rozmieszczone. Oznacza to, że dzielimy standardową krzywą normalną od do na (powiedzmy) 100 podinterwali o równej długości. Każde ze 100 elementów w N ma prawdopodobieństwo narysowania równe powierzchni objętej krzywą w odpowiednim przedziale.
Moje myślenie było następujące:
Myślę, że rozumowanie jest podobne do tego w połączonej odpowiedzi. Prawdopodobieństwo, że , przy czym jest elementem N, to w którym jest prawdopodobieństwem wyciągnięcia
Prawdopodobieństwo, że dany element m znajduje się w próbce S o rozmiarze n, wynosi
= 1 - n gatunku 1 ( 1 - F ı ) .
Obliczenia wydają się pokazywać, że wraz ze zmniejszaniem się długości pod-przedziałów odpowiedź zbiega się do tej samej liczby, co w pierwszym przypadku (wszystkie prawdopodobieństwa są równe).
Wydaje mi się to sprzeczne z intuicją (dla mnie), ponieważ konstrukcja wydaje się wrzucać elementy N, które są rzadkie, więc oczekiwałbym liczby mniejszej niż .632.
Ponadto, jeśli jest to poprawne, myślę, że mielibyśmy
które nie wiem jeszcze, czy są prawdziwe czy fałszywe.
Edycja: Jeśli to prawda, prawdopodobnie uogólni niektóre.
Dzięki za wszelkie spostrzeżenia.