Możesz użyć przedziału ufności (CI) do testowania hipotez. W typowym przypadku, jeśli CI dla efektu nie obejmuje 0, możesz odrzucić hipotezę zerową. Ale CI można wykorzystać do większej liczby, podczas gdy raportowanie, czy został on zaliczony, jest granicą przydatności testu.
Na przykład zaleca się stosowanie CI zamiast tylko testu t, ponieważ można wtedy zrobić więcej niż tylko testować hipotezy. Możesz wypowiedzieć się na temat zakresu efektów, które uważasz za prawdopodobne (te w CI). Nie możesz tego zrobić za pomocą tylko testu t. Możesz go również użyć do wypowiedzenia wartości null, czego nie można zrobić za pomocą testu t. Jeśli test t nie odrzuci wartości null, to po prostu powiesz, że nie możesz odrzucić wartości null, co niewiele mówi. Ale jeśli masz wąski przedział ufności wokół wartości zerowej, możesz zasugerować, że wartość zerowa lub wartość zbliżona do niej jest prawdopodobnie prawdziwą wartością i sugerować, że efekt leczenia lub zmienna niezależna jest zbyt mały, aby był znaczący ( lub że twój eksperyment nie
Dodano później:
Naprawdę powinienem to powiedzieć, chociaż możesz użyć CI jako testu, ale to nie jest jeden. Jest to oszacowanie zakresu, w którym według ciebie leżą wartości parametrów. Możesz dokonywać testów jak wnioskowania, ale o wiele lepiej, żeby nigdy o tym nie rozmawiać.
Który jest lepszy?
A) Efekt wynosi 0,6, t (29) = 2,8, p <0,05. Ten istotny statystycznie efekt jest ... (niektóre dyskusyjne Ensues o tej istotności statystycznej bez jakiejkolwiek wzmianki lub nawet silną zdolność do omówienia praktycznych implikacji wielkości stwierdzeniu ... pod ramach Neyman-Pearson Wielkość t i Wartości p są praktycznie bez znaczenia i wszystko, co możesz omówić, to, czy efekt jest obecny, czy nie jest obecny. Nigdy tak naprawdę nie można mówić o tym, że nie ma efektu na podstawie testu.)
lub
B) Korzystając z 95% przedziału ufności, szacuję, że efekt wynosi od 0,2 do 1,0. (pojawia się dyskusja na temat rzeczywistego efektu zainteresowania, niezależnie od tego, czy prawdopodobnymi wartościami są te, które mają jakieś szczególne znaczenie i każde użycie słowa znaczącego dla dokładnie tego, co powinno oznaczać. Ponadto szerokość elementu CI może przejść bezpośrednio do dyskusja na temat tego, czy jest to mocne odkrycie, czy też można dojść do bardziej wstępnych wniosków)
Jeśli wziąłeś podstawową klasę statystyki, możesz początkowo skłaniać się ku A. I mogą być przypadki, w których jest to lepszy sposób na raportowanie wyniku. Ale w przypadku większości prac B jest zdecydowanie lepszy. Oszacowanie zasięgu nie jest testem.