Załóżmy, że mam 20 myszy. W jakiś sposób łączę myszy w pary, aby uzyskać 10 par. Na potrzeby tego pytania może to być przypadkowa para LUB może to być rozsądna para, na przykład próba sparowania myszy z tego samego miotu, tej samej płci, o podobnej wadze, LUB może to być celowo głupia para, taka jak próbując sparować myszy z ciężarkami tak nierównymi, jak to tylko możliwe. Następnie używam liczb losowych, aby przypisać jedną mysz w każdej parze do grupy kontrolnej, a drugą mysz do grupy, która ma być leczona. Teraz przeprowadzam eksperyment, lecząc tylko myszy, które mają być leczone, ale poza tym nie zwracam uwagi na poczynione ustalenia.
Gdy przychodzi do analizy wyników, można zastosować niesparowane testowanie t lub sparowane testowanie t. W jaki sposób, jeśli w ogóle, odpowiedzi będą się różnić? (Zasadniczo jestem zainteresowany systematycznymi różnicami każdego parametru statystycznego, który należy oszacować.)
Powód, dla którego o to pytam, jest taki, że artykuł, z którym ostatnio brałem udział, został skrytykowany przez biologa za stosowanie sparowanego testu t zamiast niesparowanego testu t. Oczywiście w rzeczywistym eksperymencie sytuacja nie była tak ekstremalna jak sytuacja, którą naszkicowałem, i moim zdaniem istniały dobre powody do parowania. Ale biolog nie zgodził się.
Wydaje mi się, że nie jest możliwe nieprawidłowe poprawienie istotności statystycznej (zmniejszenie wartości p), w zarysowanych przeze mnie okolicznościach, za pomocą sparowanego testu t, a nie niesparowanego testu, nawet jeśli parowanie jest niewłaściwe. Mogłoby to jednak pogorszyć znaczenie statystyczne, gdyby myszy były źle sparowane. Czy to jest poprawne?