Czy są cytowane artykuły na temat statystyki, które faktycznie rozpowszechniły złe praktyki statystyczne?

Istnieje oczywiście wiele sposobów nadużywania metod statystycznych. Czy znasz jakieś przykłady złej praktyki statystycznej, które zostały po raz pierwszy opublikowane jako wyraźna rada (np. „Powinieneś użyć tej metody do ...”), w renomowanych czasopismach akademickich, które następnie były wielokrotnie cytowane?

Przykładem może być 10 zdarzeń na regułę predyktora, które jest często wywoływane dla modeli regresji logistycznej lub regresji PH Coxa ( LINK ).

Żeby było jasne, nie mam na myśli cytowanych prac, które wykorzystywały słabe metody statystyk - są niestety trywialnie powszechne.

references statistical-falsehoods

— DL Dahly
źródło

Szukasz oryginalnej publikacji w czasopismach statystycznych ? Nie ma końca do złych praktyk statystycznych, które są propagowane w non-statistics czasopismach (i kiedy Recenzent zwraca uwagę, że coś jest nie tak, autorzy twierdzą zwykle, aby pozostawić ją w „związać nasz papier do poprzedniego badania”). Trudno jednak znaleźć jakąkolwiek oryginalną publikację dotyczącą dyskrecji ciągłych wyników, ponieważ złe pomysły pojawiają się niezależnie.

— Stephan Kolassa

Mam na myśli wyraźną poradę, np. „Zrób to ...”. Zredagowałem pytanie, aby wyjaśnić. Dzięki.

— DL Dahly

Często nie widać wyraźnych poleceń „zrób to” w dziennikach statystyk. Widzisz to w niektórych obszarach zastosowań, szczególnie gdy są napisane przez osoby, które krytykują niektóre problematyczne praktyki (gdzie czasami mówią „nie rób A, rób B” - ale mogą same udzielać dość wątpliwych rad. czymś, czego szukasz? Nie czytam aż tyle czasopism z innych dziedzin, ale widziałem już takie gazety w przeszłości. (Nawet jeśli pamiętam dokładnie, gdzie, ale nie mogę powiedzieć wiedzieć, czy którykolwiek z nich był bardzo cytowany). ... ctd

— Glen_b -Reinstate Monica

ctd ... Chociaż nie jestem gazetą, mogę wskazać na wątpliwe porady w podręczniku, który wydaje się być popularny wśród osób uczących się robić statystyki dla badań w zakresie jego zastosowania.

— Glen_b

Wyjaśnij, co rozumiesz przez „fałsz statystyczny”. Nie jest to standardowa koncepcja w statystyce, która dotyczy raczej zalecania procedur, które są mniej lub bardziej odpowiednie dla danego zadania. Tak, niektóre procedury są znane jako gorsze od innych, ale trudno je interpretować jako „kłamstwo”. Przez „fałsz” rozumiałbyś jakąś mylącą interpretację lub poradę dotyczącą zastosowania niedopuszczalnej procedury lub poradę opartą na błędzie matematycznym lub… co?

— whuber

Odpowiedzi:

RA Fisher, „Arrangement of Field Experiments”. Journal of Ministerstwa Rolnictwa Wielkiej Brytanii. 33: 503–513. 1926.

Według różnych źródeł w Internecie, ten artykuł jest źródłem użycia jako progu istotności w dowolnym teście statystycznym. $\alpha = 0.05$

... wygodnie jest narysować linię na poziomie, na którym możemy powiedzieć: „Albo coś jest w leczeniu, albo nastąpił przypadek, który nie występuje więcej niż raz na dwadzieścia prób”.

... Jeśli jeden na dwadzieścia nie wydaje się wystarczająco wysokim prawdopodobieństwem, możemy, jeśli wolimy, narysować linię na jeden na pięćdziesiąt (punkt 2 procent) lub jeden na sto (punkt 1 procent). Osobiście pisarz woli ustawić niski standard znaczenia na poziomie 5 procent i całkowicie ignorować wszystkie wyniki, które nie osiągają tego poziomu. Fakt naukowy należy uznać za ustalony eksperymentalnie tylko wtedy, gdy właściwie zaprojektowany eksperyment rzadko nie daje takiego poziomu istotności.

— Flądrarz
źródło

W ekonometrii z pewnością można znaleźć przykład propagowanych metod przez znanych (i wysoko wykwalifikowanych) ekonometrów opublikowanych w przyzwoitych czasopismach. Nie znam pracy teoretycznej, ale Lalonde (1986) słynie z tego, że obecnie stosowane metody nie są zbyt dobre: porównuje te same metody eksperymentalne z zestawem danych z metodami obserwacyjnymi i znajduje duże różnice w dziedzinie (przyczynowego) leczenia ewaluacja . Istnieje duża literatura, która propagowała te nie eksperymentalne metody, które były wówczas używane i które są często używane do dziś.

Następnie odbyła się (i myślę, że nadal jest) debata na temat tego, czy dopasowanie wyników skłonności jest możliwym rozwiązaniem (patrz na przykład tutaj ).

Ponadto istnieje wiele kontrowersji dotyczących estymacji zmiennych instrumentalnych . Wnioski z cytowanych oryginalnych prac zostały zakwestionowane. To prawdopodobnie najbliższy przykład twojego pytania. Bound i Jaeger (1996 i kolejne artykuły) zakwestionowali wyniki dobrze znanej pracy Angrista i Kruegera (1991; 2700 cytowań według Google Scholar), która zasadniczo ustanowiła metodę zmiennej instrumentalnej w stosowanej literaturze ekonometrycznej.

Toczy się również duża debata na temat stosowności tak zwanych oszacowań zredukowanych do ustalenia związku przyczynowego, patrz na przykład Imbens (2010) .

Kolejny duży temat dotyczy oczywiście standardowego błędu. Być może można znaleźć dobrze znany papier propagujący wartości p. W ekonometrii błąd standardowy dla dłuższych szeregów czasowych był często błędnie obliczany (w projekcie różnicy w różnicy ) z powodu niewłaściwych istniejących metod, patrz tutaj . Nie znam jednak oryginalnie cytowanego artykułu proponującego te metody w tym kontekście, ale jestem pewien, że znajdziesz kilka przykładów w tej dziedzinie.

Źródła:

Angrist, Joshua D. i Alan B. Keueger. „Czy obowiązkowe uczęszczanie do szkoły wpływa na szkolnictwo i zarobki?” The Quarterly Journal of Economics 106, no. 4 (1991): 979–1014.

Bertrand, Marianne, Esther Duflo i Sendhil Mullainathan. „Jak bardzo powinniśmy ufać szacunkom różnic w różnicach?” Kwartalny dziennik ekonomii 119, nr. 1 (2004): 249–275.

Bound, John i David A. Jaeger. O ważności sezonu urodzenia jako instrumentu w równaniach płacowych: komentarz do Angrista i Kruegera „Czy obowiązkowa obecność w szkole wpływa na Scho. Nr w5835. National Bureau of Economic Research, 1996.

Dehejia, Rajeev. „Praktyczne dopasowanie wyników skłonności: odpowiedź dla Smitha i Todda”. Journal of econometrics 125, no. 1-2 (2005): 355–364.

Imbens, Guido W. „Lepiej PÓŹNIEJ niż nic: niektóre komentarze na temat Deaton (2009) oraz Heckman i Urzua (2009)”. Journal of Economic literature 48, no. 2 (2010): 399–423.

LaLonde, Robert J. „Ocena ocen ekonometrycznych programów szkoleniowych z danymi eksperymentalnymi”. The American Economic Review (1986): 604-620. *

— Arne Jonas Warnke
źródło

Próbuję (choć nie tak mocno):

Bardzo przydatny [Cameron, AC i Miller, DL (2015). Przewodnik dla praktyków dotyczący wnioskowania odpornego na klastry. Journal of Human Resources, 50 (2), 317-372.] // już 1900 Cytaty Google Scholar // zawiera porady dotyczące odpowiedniego poziomu grupowania błędów standardowych:

„Konsensus ma być konserwatywny i unikać stronniczości oraz stosować większe i bardziej zagregowane klastry, jeśli to możliwe, aż do momentu, w którym istnieje obawa o zbyt małą liczbę klastrów”.

Jednakże [Abadie, A., Athey, S., Imbens, GW i Wooldridge, J. (2017). Kiedy należy dostosować standardowe błędy dla grupowania? (Nr w24003). National Bureau of Economic Research.] Pokazuje, że „w rzeczywistości klastrowanie jest zbyt szkodliwe na zbyt zagregowanym poziomie”. Zobacz stronę 1 później: https://economics.mit.edu/files/13927

Być może uda ci się również stworzyć bardziej zdecydowaną sprawę, zaczynając od dwóch nieporozumień podkreślonych przez Abadie i in. (2017).

— Alexandre Cazenave-Lacroutz
źródło