스케일을 구성 할 때 일반 점수 합 보다 " 인수 점수 "를 언제 사용할 지에 대한 제안을 받고 싶습니다 . 즉, 요인을 점수화하는 "정제되지 않은"방법보다 "정제 된"방법입니다. DiStefano et al. (2009; pdf )에 다음 사항을 강조했습니다.
요인 점수 계산 방법에는 정제 및 비 정제의 두 가지 주요 클래스가 있습니다. 비 정제 방법은 요인 분포에 대한 개인의 배치에 대한 정보를 제공하는 비교적 단순하고 누적 된 절차입니다. 단순함은 매력적인 기능, 즉 정제되지 않은 메소드는 계산하기 쉽고 해석하기 쉽습니다. 정제 된 계산 방법은보다 정교하고 기술적 인 접근 방식을 사용하여 요인 점수를 만듭니다. 그것들은 비 정제 방법보다 더 정확 하고 복잡하며 표준화 된 점수 인 추정치를 제공합니다.
내 생각에, 연구와 설정에서 사용할 수있는 척도를 만드는 것이 목표라면 모든 척도 항목의 단순 합 또는 평균 점수가 의미가 있습니다. 그러나 프로그램의 치료 효과를 평가하는 것이 목표이며, 중요한 대조는 치료 대 대조군 그룹의 샘플 내에 있다고 가정 해 봅시다. 합계 또는 평균을 스케일링하기 위해 요인 점수를 선호하는 이유가 있습니까?
대안에 대해 구체적으로 설명하려면 다음 간단한 예를 들어보십시오.
library(lavaan)
library(devtools)
# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1 3 4 3 4 3 3 4 4 3
# 2 2 1 2 2 4 3 2 1 3
# 3 1 3 4 4 4 2 1 2 2
# 4 1 2 1 2 1 2 1 3 2
# 5 3 3 4 4 1 1 2 4 1
# 6 2 2 2 2 2 2 1 1 1
# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf
# non-refined -----------------------------------------------------------------
mydata$sumScore <- rowSums(mydata[, 1:9])
mydata$avgScore <- rowSums(mydata[, 1:9])/9
hist(mydata$avgScore)
# refined ---------------------------------------------------------------------
model <- '
tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
'
fit <- sem(model, data = mydata, meanstructure = TRUE,
missing = "pairwise", estimator = "WLSMV")
factorScore <- predict(fit)
hist(factorScore[,1])
"more exact"
. 선형 적으로 계산 된 요인 점수 중 회귀 방법은 "가장 알려지지 않은 실제 요인 값과 가장 밀접한 관련이 있습니다"라는 의미에서 가장 "정확한"방법입니다. 예, 더 정확합니다 (선형 대수 접근법 내에서). 그러나 완전히 정확하지는 않습니다.