Właśnie obejrzałem wykład na temat wnioskowania statystycznego („porównywanie proporcji i środków”), będący częścią wstępu do kursu online dotyczącego statystyk. Materiał miał dla mnie jak najmniej sensu, jak zawsze (do tej pory musiałem to widzieć dziesiątki razy, rozłożone w ciągu ostatnich trzech dekad).
Szukam książki o „podstawowych statystykach-101” (ocena punktowa, ocena szacunkowa, wnioskowanie statystyczne, testowanie hipotez, projekt badania), która poważnie traktuje problem przekonania sceptycznego czytelnika ...
Poniżej podaję kilka przykładów typu pytania, że autor Szukam weźmie poważnie i wiedzą, jak rozwiązać przekonująco.
Ale najpierw pozwólcie mi poświęcić chwilę na podkreślenie, że w tym poście nie zadaję tych pytań. Proszę nie odpowiadać na nie! Podaję je tylko jako przykłady oraz w ramach „testu lakmusowego” (dla typu autora wyszukiwania).
Jeśli „proporcja” jest po prostu średnią zmiennej logicznej (tj. Takiej, która przyjmuje tylko wartości 0 i 1), dlaczego naucza się różnych procedur przeprowadzania wnioskowania statystycznego z „proporcjami” i „środkami”?
Jeśli rozkład normalny jest tak solidny, że przyjęcie normalności daje dobre wyniki nawet w przypadkach, gdy dane te nie są całkiem normalnie rozłożone, a jeśli rozkład t jest tak normalny, dlaczego całe zamieszanie związane z użyciem rozkładu t zamiast normalna?
Czym dokładnie są „stopnie swobody” i dlaczego się o nie martwimy?
Co to znaczy mówić o „prawdziwej” wartości parametru, biorąc pod uwagę, że po prostu używamy rozkładów, które wyglądają podobnie do danych?
Dlaczego „eksploracyjna analiza danych” jest dobra, a „szpiegowanie danych” to zła rzecz?
Jak powiedziałem, zniechęca mnie postawa wynikająca z zaniedbania takich pytań. To nie „postawa epistemologiczna”, którą chcę widzieć u kogoś, kto mnie czegoś uczy. Szukam autorów, którzy szanują sceptycyzm i racjonalność czytelnika, i którzy wiedzą, jak się do nich odnieść (niekoniecznie zaglądając na strony z formalizmami i informacjami technicznymi).
Zdaję sobie sprawę, że jest to wysoki porządek, a może szczególnie, jeśli chodzi o statystyki. Dlatego nie oczekuję, że wielu autorom się to uda. Ale w tej chwili byłbym zadowolony ze znalezienia tylko jednego .
Dodam, że nie jestem niechętny matematyce. Przeciwnie, kocham matematykę. (Nie mam nic przeciwko analizie [inaczej „rachunek zaawansowany”], algebrze liniowej, teorii prawdopodobieństwa, a nawet podstawowej teorii miary.)
To powiedziawszy, moim zainteresowaniem w tej chwili są statystyki „stosowane”, „praktyczne”, „codzienne”, „realne” (w przeciwieństwie do teoretycznych subtelności). (Ale ja też nie chcę książki kucharskiej!)
FWIW, przeczytałem kilka pierwszych rozdziałów analizy danych przy użyciu regresji i modeli wielopoziomowych / hierarchicznych autorstwa Gelmana i Hilla i podoba mi się ton autorów. Ich koncentracja jest praktyczna, ale w razie potrzeby przejdź do teorii. Często też wycofują się i krytycznie oceniają standardowe praktyki, a także przedstawiają szczere opinie, które przemawiają do zdrowego rozsądku czytelnika. Niestety, autorzy ci nie napisali książki poświęconej tematowi, o który pytam w tym poście (materiały „Stats 101”, jak opisano powyżej). Wiem też, że jeden z tych autorów (Gelman) jest współautorem bardzo cenionej analizy danych bayesowskich , ale znowu nie tego obecnie szukam.
EDYTOWAĆ:
Dikran Marsupial podnosi następujący zarzut:
Nie sądzę, aby zaniedbywanie pytań było konieczne, przychodzi moment, w którym udzielenie odpowiedzi na każde pytanie odwraca uwagę od przedstawienia podstawowych pojęć, które często są ważniejsze (szczególnie w książce ze statystykami 101!).
Zgadzam się z tym. Bardziej trafne byłoby dla mnie stwierdzenie, że szukam „drugiego spojrzenia na podstawowe statystyki”. W gruncie rzeczy, jako moją motywację, spojrzałem na podręczniki używane na kursach dla absolwentów na temat wnioskowania (powiedzmy) i odkryłem, że zbyt zaniedbywali pytania takie jak te, które wymieniłem. Jeśli już, wydawali się jeszcze mniej skłonni do zagłębiania się w takie pytania (aby mogli skupić się na takich kwestiach, jak warunki dla pewnej zbieżności lub innej z tego lub innego ...).
Problem polega na tym, że bardziej zaawansowane książki są adresowane do radykalnie odmiennej populacji czytelników, w której „sceptycyzm osoby postronnej” został drastycznie wyczerpany. IOW, ci, którzy biorą statystyki na poziomie magisterskim, nie są już zainteresowani pytaniami, które mnie niepokoją. Nie są już sceptyczni wobec tych rzeczy. (Jak sobie poradzili z gardzeniem sceptycyzmem? Być może niektórzy nigdy nie byli zbyt krytyczni, zwłaszcza jeśli dość wcześnie nauczyli się swoich statystyk - wiem, że sam nie byłem szczególnie krytycznym studentem pierwszego roku, chociaż nie byłem weźcie więc statystyki. Inni mogli mieć nauczycieli, którzy wypełnili braki w swoich podręcznikach. Niektórzy mogli być na tyle sprytni, aby samodzielnie znaleźć odpowiedzi na takie pytania. Kto wie.)