Czy to ważne, jak próbkujesz populację?


9

Mam dobrze wymieszaną kadzinę zawierającą nieskończoną liczbę kulek. W kadzi jest nieskończona ilość kulek, ale występują one tylko w nieznanej, ale skończonej liczbie odmian : jest nieznany, a dla narysowanie marmuru typu może być bardziej prawdopodobne niż narysowanie marmuru typu .

V.={v1,v2),v3),...,vk}
kjajotvjavjot

W eksperymencie maszyna próbkuje kadź przy użyciu nieznanej procedury. Maszyna zgłasza zestaw opisujący odmian kulek z próbki: Xqk

XV.;|X|=q

Próby tego eksperymentu są powtarzane ( jest ustalone między próbami) i otrzymujemy sekwencję podzbiorów , .qV.(X1,X2),)

Jedyne inne rzeczy, które wiemy to:

  • próby są niezależne i identyczne
  • maszyna zgłasza najczęściej występujące odmiany w swojej próbceq

Nie wiemy dokładnie, jak maszyna próbkuje kulki. Może wybrać dużą liczbę kulek, a następnie zgłosić najczęściej. Alternatywnie może zbierać kulki, dopóki nie będzie odmian. Są też inne rzeczy, które mógłby zrobić.qq

Czy na przebieg naszych prób będzie miała wpływ procedura próbkowania maszyny?(X1,X2),)


3
+1 To świetne pytanie, ponieważ docenia to, że losowe pobieranie próbek ma więcej niż niejasną formę arbitralności lub braku wiedzy na temat procedury pobierania próbek.
whuber

Zasada próbkowania z pewnością będzie miała znaczenie. W przeciwnym razie rozważ tę procedurę: maszyna, na każdej próbie, zawsze wybiera pojedynczy marmur typu 1 (pierwsza odmiana). Każde losowanie będzie niezależne i będzie miało identyczny rozkład (trywialnie), a otrzymasz q = 1, całkowicie niepomocny wynik.
AlaskaRon,

Odpowiedzi:


9

Prostym sposobem sprawdzenia, czy metoda ma znaczenie, jest wybranie określonych prawdopodobieństw dla rodzajów marmurów i obliczenie szansy każdego podzbioru zgodnie z niektórymi metodami. Nie może to jednak udowodnić, że metoda nie ma znaczenia.

Załóżmy, że są 3) typy i szanse każdego typu są 1/2), 1/4, i 1/4odpowiednio. Załóżmy, że wybierasz2) rodzaje kulek.

Załóżmy, że po wybraniu marmuru ignorujesz resztę tego rodzaju. Szansa, którą masz{v2),v3)} jest 2)1/41/3)=1/6.

Załóżmy, że odrzucasz pary z powtarzającymi się typami. Szansa na{v2),v3)} jest

2)1/41/42)1/41/4+2)1/2)1/4+2)1/2)1/4=1/81/8+1/4+1/4=1/5

Ponieważ są one różne, metoda, z której korzysta maszyna, ma znaczenie. Odrzucanie par z typami powtarzanymi powoduje, że pary zwykłych typów są mniej obciążone.

Dwie z wymienionych metod są równoważne. Ignorowanie reszty tego rodzaju po zerwaniu marmuru jest tym samym, co zrywanie, dopóki go nie maszq różne rodzaje.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.