Myślę, że powinieneś zacząć od pytania, co według nich naprawdę oznacza powiedzenie o osobie, że jest ona w stanie odróżnić coca-colę od pepsi. Co takiego osoba może zrobić, czego inni nie mogą zrobić?
Większość z nich nie będzie miała takiej definicji i nie będzie w stanie jej sformułować, jeśli zostanie o to poproszony. Jednak znaczenie tego wyrażenia jest tym, co daje nam statystyka, i to właśnie możesz przynieść ze swoją klasą „upodobania do statystyki”.
Jednym z punktów statystyki jest udzielenie dokładnej odpowiedzi na pytanie: „co to znaczy powiedzieć komuś, że on lub ona jest w stanie odróżnić coca-colę od pepsi”
Odpowiedź brzmi: on lub ona jest lepsza niż zgadywanka do klasyfikowania filiżanek w ślepym teście. Zgadywanka nie potrafi odróżnić, po prostu zgaduje cały czas. Zgadywanka jest dla nas użytecznym wynalazkiem, ponieważ wiemy, że nie ma takiej zdolności. Wyniki zgadywanki są przydatne, ponieważ pokazują, czego powinniśmy oczekiwać od kogoś, kto nie ma zdolności, którą testujemy.
Aby sprawdzić, czy dana osoba jest w stanie odróżnić coca-colę od pepsi, należy porównać jej klasyfikację filiżanek w ślepym teście z klasyfikacją, którą zrobiłaby zgadywanka. Tylko jeśli jest lepszy od zgadywanki, jest w stanie powiedzieć różnicę.
Jak zatem określasz, czy jeden wynik jest lepszy od innego? Co jeśli są prawie takie same?
Jeśli dwie osoby sklasyfikują niewielką liczbę filiżanek, to niesprawiedliwe jest twierdzenie, że jedna jest lepsza od drugiej, jeśli wyniki są prawie takie same. Być może zwycięzca miał dzisiaj szczęście i wyniki zostałyby odwrócone, gdyby jutro powtórzono zawody?
Jeśli mamy uzyskać wiarygodny wynik, nie może on opierać się na niewielkiej liczbie klasyfikacji, ponieważ to wynik może decydować o wyniku. Pamiętaj, że nie musisz być doskonały, aby mieć tę umiejętność, musisz być lepszy niż maszyna do zgadywania. W rzeczywistości, jeśli liczba klasyfikacji jest zbyt mała, nawet osoba, która zawsze poprawnie identyfikuje coca-colę, nie będzie w stanie wykazać, że jest lepsza niż zgadywanie. Na przykład, jeśli jest tylko jeden puchar do sklasyfikowania, nawet zgadywanka będzie miała 50 procent szans na sklasyfikowanie całkowicie poprawnie. To nie jest dobre, ponieważ oznacza to, że w 50 procentach prób błędnie stwierdzilibyśmy, że dobry identyfikator coca-coli nie jest lepszy niż zgadywanie. Bardzo niesprawiedliwie.
Im więcej pucharów jest do sklasyfikowania, tym więcej okazji do ujawnienia niezdolności zgadywania i więcej okazji do popisania się dobrym identyfikatorem coca-coli.
10 filiżanek może być dobrym miejscem na rozpoczęcie. Ile poprawnych odpowiedzi człowiek musi wtedy wykazać, że jest lepszy od maszyny?
Zapytaj ich, co by zgadli.
Następnie pozwól im korzystać z maszyny i dowiedzieć się, jak jest ona dobra, tzn. Niech wszyscy uczniowie wygenerują serię dziesięciu domysłów, np. za pomocą kości lub losowego generatora na smartfonie. Aby być pedagogicznym, powinieneś przygotować serię dziesięciu właściwych odpowiedzi, na podstawie których domniemywać należy domysły.
Zapisz wszystkie wyniki na tablicy. Wydrukuj posortowane wyniki na tablicy. Wyjaśnij, że człowiek musiałby być lepszy niż 95 procent tych wyników, zanim statystyk uzna swoją zdolność do odróżnienia coca-coli od pepsi. Narysuj linię oddzielającą 95% najgorszych wyników od 5% najlepszych wyników.
Następnie pozwól kilku uczniom sklasyfikować 10 filiżanek. Do tej pory uczniowie powinni wiedzieć, ile praw muszą mieć, aby udowodnić, że potrafią odróżnić.
Wszystko to nie jest jednak wykonalne w ciągu 10 minut.