Byłbym zainteresowany otrzymywaniem sugestii, kiedy używać „ wyników czynnikowych ” zamiast zwykłej sumy wyników podczas konstruowania skal. Tj. „Wyrafinowane” w porównaniu z „nierafinowanymi” metodami oceny czynnika. Od DiStefano i in. (2009; pdf ), podkreślenie dodane:
Istnieją dwie główne klasy metod obliczania wyniku czynnikowego: wyrafinowane i nierafinowane. Nierafinowane metody są stosunkowo prostymi, kumulatywnymi procedurami zapewniającymi informacje o umiejscowieniu poszczególnych osób w rozkładzie czynników. Prostota nadaje się do niektórych atrakcyjnych cech, tj. Nierafinowane metody są łatwe do obliczenia i interpretacji. Udoskonalone metody obliczeniowe tworzą wyniki czynnikowe przy użyciu bardziej wyrafinowanych i technicznych metod. Są one dokładniejsze i bardziej złożone niż nierafinowane metody i zapewniają oszacowania, które są ustandaryzowanymi wynikami.
Moim zdaniem, jeśli celem jest stworzenie skali, która może być używana w badaniach i ustawieniach, wówczas sensowna jest prosta suma lub średni wynik wszystkich elementów skali. Powiedzmy jednak, że celem jest ocena efektów terapeutycznych programu, a istotny kontrast występuje w próbie - leczenie w porównaniu z grupą kontrolną. Czy jest jakiś powód, dla którego moglibyśmy preferować wyniki czynnikowe niż skalować sumy lub średnie?
Aby być konkretnym na temat alternatyw, weź ten prosty przykład:
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
They are more exact
Ten dodatkowy nacisk nie powinien odwracać uwagi od faktu, że nawet wyniki czynników są nieuchronnie niedokładne („niedookreślone”).
"more exact"
. Spośród liniowo obliczonych wyników czynnikowych metoda regresji jest najbardziej „dokładna” w sensie „najbardziej skorelowana z nieznanymi prawdziwymi wartościami czynników”. Tak więc, bardziej dokładne (w ramach liniowego podejścia algebraicznego), ale nie do końca dokładne.