Byłbym zainteresowany otrzymywaniem sugestii, kiedy używać „ wyników czynnikowych ” zamiast zwykłej sumy wyników podczas konstruowania skal. Tj. „Wyrafinowane” w porównaniu z „nierafinowanymi” metodami oceny czynnika. Od DiStefano i in. (2009; pdf ), podkreślenie dodane:
Istnieją dwie główne klasy metod obliczania wyniku czynnikowego: wyrafinowane i nierafinowane. Nierafinowane metody są stosunkowo prostymi, kumulatywnymi procedurami zapewniającymi informacje o umiejscowieniu poszczególnych osób w rozkładzie czynników. Prostota nadaje się do niektórych atrakcyjnych cech, tj. Nierafinowane metody są łatwe do obliczenia i interpretacji. Udoskonalone metody obliczeniowe tworzą wyniki czynnikowe przy użyciu bardziej wyrafinowanych i technicznych metod. Są one dokładniejsze i bardziej złożone niż nierafinowane metody i zapewniają oszacowania, które są ustandaryzowanymi wynikami.
Moim zdaniem, jeśli celem jest stworzenie skali, która może być używana w badaniach i ustawieniach, wówczas sensowna jest prosta suma lub średni wynik wszystkich elementów skali. Powiedzmy jednak, że celem jest ocena efektów terapeutycznych programu, a istotny kontrast występuje w próbie - leczenie w porównaniu z grupą kontrolną. Czy jest jakiś powód, dla którego moglibyśmy preferować wyniki czynnikowe niż skalować sumy lub średnie?
Aby być konkretnym na temat alternatyw, weź ten prosty przykład:
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
They are more exactTen dodatkowy nacisk nie powinien odwracać uwagi od faktu, że nawet wyniki czynników są nieuchronnie niedokładne („niedookreślone”).
"more exact". Spośród liniowo obliczonych wyników czynnikowych metoda regresji jest najbardziej „dokładna” w sensie „najbardziej skorelowana z nieznanymi prawdziwymi wartościami czynników”. Tak więc, bardziej dokładne (w ramach liniowego podejścia algebraicznego), ale nie do końca dokładne.


