Chociaż czuję się trochę zakłopotany, zaprzeczając zarówno „szanowanemu tekstowi”, jak i innemu użytkownikowi CV, wydaje mi się, że na formułę Spearmana-Browna nie wpływają przedmioty o różnym stopniu trudności. Dla pewności formuła Spearmana-Browna zwykle wywodzi się z założenia, że mamy równoległe przedmioty, co implikuje (między innymi), że przedmioty mają jednakową trudność. Ale okazuje się, że to założenie nie jest konieczne; można go rozluźnić, aby umożliwić nierówne trudności, a formuła Spearmana-Browna nadal będzie obowiązywać. Pokazuję to poniżej.
Przypomnijmy, że w klasycznej teorii testu przyjmuje się , że pomiar jest sumą składowej „wyniku rzeczywistego” i składowej błędu , to znaczy
przy nieskorelowanym iZałożeniem równoległych elementów jest to, że wszystkie elementy mają takie same prawdziwe wyniki, różniące się tylko składowymi błędów, chociaż zakłada się, że mają one jednakową wariancję. Symbolami, dla każdej pary pozycji iT E X = T + E , T E X X ′ T = T ′XT.mi
X= T+ E,
T.miXX′T = T ′ + c ′T=T′var(E)=var(E′).
Zobaczmy, co się stanie, gdy rozluźnimy pierwsze założenie, tak że elementy mogą różnić się trudnościami, a następnie uzyskamy wiarygodność całkowitego wyniku testu na podstawie tych nowych założeń. W szczególności załóżmy, że prawdziwe wyniki mogą różnić się stałą addytywną, ale błędy wciąż mają tę samą wariancję. W symbolach
Wszelkie różnice w poziomie trudności są rejestrowane przez stałą addytywną. Na przykład, jeśli , to wyniki na są zwykle wyższe niż wyniki na , więc jest „łatwiejsze” niż . Możemy to nazwać
zasadniczo równoległymic ′ > 0 X X ′ X X ′T=T′+c′var(E)=var(E′).
c′>0XX′XX′elementy, analogicznie do założenia „istotnej równoważności tau”, która rozluźnia model równoważny tau w podobny sposób.
Teraz, aby uzyskać wiarygodność formy testowej takich przedmiotów. Rozważ test składający się z zasadniczo równoległych pozycji, których suma daje wynik testu. Wiarygodność jest z definicji stosunkiem prawdziwej wariancji punktacji do obserwowanej wariancji punktacji. Jeśli chodzi o niezawodność poszczególnych elementów, z definicji istotnego równoległości wynika, że mają one tę samą niezawodność, którą oznaczamy za pomocą , z jest prawdziwą wariancją wyniku, a wariancją błędu. Aby uzyskać wiarygodność całkowitego wyniku testu, najpierw badamy wariancję całkowitego wyniku testu, który wynosi
ρ = σ 2 T / ( σ 2 T + σ 2 E ) σ 2 T σ 2 E var ( k ∑ i = 1 T i + E i )kρ=σ2T/(σ2T+σ2E)σ2Tσ2E
var(∑i=1kTi+Ei)=var(∑i=1kT+ci+Ei)=k2σ2T+kσ2E,
Tσ2Tσ2Ek2σ2Tk2σ2T+kσ2E=kσ2Tkσ2T+σ2X−σ2T=kρ1+(k−1)ρ,
@JeremyMiles podnosi kilka interesujących i ważnych punktów na temat tego, co może się zdarzyć, gdy zwiększymy długość testu „w prawdziwym świecie”, ale przynajmniej zgodnie z wyidealizowanymi założeniami klasycznej teorii testów, różnice w trudnościach przedmiotów nie mają znaczenia dla wiarygodności formularz testowy (w jaskrawym kontraście z założeniami współczesnej teorii odpowiedzi na przedmiot!). Ta sama podstawowa linia rozumowania jest również powodem, dla którego zwykle mówimy o zasadniczej równoważności tau zamiast równoważności tau, ponieważ większość wszystkich ważnych wyników dotyczy bardziej łagodnego przypadku, w którym trudności przedmiotów (tj. Środki) mogą się różnić.