W dniu 25 lutego 2015 r. Czasopismo Basic and Applied Social Psychology opublikowało artykuł wstępny zakazujący wartości i przedziałów ufności we wszystkich przyszłych artykułach.
Mówią w szczególności (formatowanie i podkreślanie są moje):
[...] przed publikacją autorzy będą musieli usunąć wszelkie pozostałości z NHSTP [procedura testowania znaczenia hipotezy zerowej] ( wartości wartości wartości , stwierdzenia o różnicach „znaczących” lub ich braku , i tak dalej).
Analogicznie do tego, w jaki sposób NHSTP nie zapewnia prawdopodobieństwa hipotezy zerowej, która jest potrzebna do uzasadnienia jej odrzucenia, przedziały ufności nie stanowią mocnego dowodu, aby stwierdzić, że interesujący parametr populacji prawdopodobnie mieści się w podanym zakresie interwał. Dlatego przedziały ufności są również zakazane w BASP.
[...] w odniesieniu do procedur bayesowskich zastrzegamy sobie prawo do wydawania indywidualnych orzeczeń, dlatego też procedury bayesowskie nie są wymagane ani zakazane od BASP.
[...] Czy wymagane są wnioskowania statystyczne? - Nie [...] Jednak BASP będzie wymagał silnych statystyk opisowych, w tym rozmiarów efektów.
Nie omawiajmy tutaj problemów i niewłaściwego wykorzystania wartości ; jest już wiele doskonałych dyskusji na temat CV, które można znaleźć, przeglądając znacznik p-value . Krytyka wartości często idzie w parze z poradą dotyczącą zgłaszania przedziałów ufności dla parametrów będących przedmiotem zainteresowania. Na przykład w tej bardzo dobrze uzasadnionej odpowiedzi @gung sugeruje zgłaszanie wielkości efektów z przedziałami ufności wokół nich. Ale ten dziennik zakazuje również przedziałów ufności.
Jakie są zalety i wady takiego podejścia do przedstawiania danych i wyników eksperymentalnych w porównaniu do „tradycyjnego” podejścia z wartościami , przedziałami ufności i znaczną / nieznaczną dychotomią? Reakcja na ten zakaz wydaje się w większości negatywna; więc jakie są wady? Amerykańskie Stowarzyszenie Statystyczne opublikowało nawet krótki zniechęcający komentarz na temat tego zakazu, mówiąc, że „ta polityka może mieć swoje własne negatywne konsekwencje”. Jakie mogą być te negatywne konsekwencje?
Lub, jak to ujął @whuber, czy takie podejście powinno być ogólnie propagowane jako paradygmat badań ilościowych? A jeśli nie to dlaczego nie?
PS. Zauważ, że moje pytanie nie dotyczy samego zakazu ; chodzi o sugerowane podejście. Nie pytam też o wnioskowanie częstokrzyskie vs. bayesowskie. Artykuł wstępny jest dość negatywny także w odniesieniu do metod bayesowskich; więc chodzi przede wszystkim o stosowanie statystyk, a nie o korzystanie ze statystyk w ogóle.