평가 점수와 예상 요인 점수의 합?


12

스케일을 구성 할 때 일반 점수 합 보다 " 인수 점수 "를 언제 사용할 지에 대한 제안을 받고 싶습니다 . 즉, 요인을 점수화하는 "정제되지 않은"방법보다 "정제 된"방법입니다. DiStefano et al. (2009; pdf )에 다음 사항을 강조했습니다.

요인 점수 계산 방법에는 정제 및 비 정제의 두 가지 주요 클래스가 있습니다. 비 정제 방법은 요인 분포에 대한 개인의 배치에 대한 정보를 제공하는 비교적 단순하고 누적 된 절차입니다. 단순함은 매력적인 기능, 즉 정제되지 않은 메소드는 계산하기 쉽고 해석하기 쉽습니다. 정제 된 계산 방법은보다 정교하고 기술적 인 접근 방식을 사용하여 요인 점수를 만듭니다. 그것들은 비 정제 방법보다 더 정확 하고 복잡하며 표준화 된 점수 인 추정치를 제공합니다.

내 생각에, 연구와 설정에서 사용할 수있는 척도를 만드는 것이 목표라면 모든 척도 항목의 단순 합 또는 평균 점수가 의미가 있습니다. 그러나 프로그램의 치료 효과를 평가하는 것이 목표이며, 중요한 대조는 치료 대 대조군 그룹의 샘플 내에 있다고 가정 해 봅시다. 합계 또는 평균을 스케일링하기 위해 요인 점수를 선호하는 이유가 있습니까?

대안에 대해 구체적으로 설명하려면 다음 간단한 예를 들어보십시오.

library(lavaan)
library(devtools)

# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
  gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
  source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
  head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1  3  4  3  4  3  3  4  4  3
# 2  2  1  2  2  4  3  2  1  3
# 3  1  3  4  4  4  2  1  2  2
# 4  1  2  1  2  1  2  1  3  2
# 5  3  3  4  4  1  1  2  4  1
# 6  2  2  2  2  2  2  1  1  1

# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf

# non-refined -----------------------------------------------------------------
  mydata$sumScore <- rowSums(mydata[, 1:9])
      mydata$avgScore <- rowSums(mydata[, 1:9])/9
  hist(mydata$avgScore)

# refined ---------------------------------------------------------------------
  model <- '
            tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
           '
  fit <- sem(model, data = mydata, meanstructure = TRUE,
             missing = "pairwise", estimator = "WLSMV")
  factorScore <- predict(fit)
  hist(factorScore[,1])

제목에서 "중재"를 제거하여 질문을보다 일반적으로 들리게 만들었습니다. 중재에는 두 종류의 구조 계산 간의 구별에 대한 고유하고 구체적인 관련성이 없을 수 있기 때문입니다. 동의하지 않으면 편집 내용을 롤백 할 수 있습니다.
ttnphns

1
They are more exact이러한 추가 강조는 요인 점수조차도 필연적으로 부정확 하다는 사실 ( "미결정") 에서 우리를 방해해서는 안됩니다 .
ttnphns

이 비슷한 질문을 참조하십시오 : stats.stackexchange.com/q/31967/3277 .
ttnphns

"중재"는 특별한 유스 케이스와 관련이 있다고 생각하지만 제목에있을 필요는 없습니다. 질문의 핵심 문제를 강조했습니다. "보다 정확한"에 대한 강조에 관해서는, 요인 점수가 미정 인 것에 대한 관찰을 감안할 때이 점에 대해 생각하는 것이 궁금했습니다. 다른 질문에 대한 링크를 주셔서 감사합니다.
Eric Green

"more exact". 선형 적으로 계산 된 요인 점수 중 회귀 방법은 "가장 알려지지 않은 실제 요인 값과 가장 밀접한 관련이 있습니다"라는 의미에서 가장 "정확한"방법입니다. 예, 더 정확합니다 (선형 대수 접근법 내에서). 그러나 완전히 정확하지는 않습니다.
ttnphns

답변:


6

나는 현재의 일부 프로젝트에서이 아이디어와 씨름하고 있습니다. 나는 당신이 여기에서 추정되는 것을 스스로에게 물어봐야한다고 생각합니다. 단일 요인 모형이 적합하면 요인 점수가 잠재 요인을 추정합니다. 매니페스트 변수의 직선 합계 또는 평균은 모든 관측치가 요인에 균등하게로드되고 고유성도 동일하지 않은 한 다른 것으로 추정합니다. 그리고 그 밖의 다른 것은 아마도 큰 이론적 관심이 아닙니다.

따라서 단일 요인 모형이 적합하면 요인 점수를 사용하는 것이 좋습니다. 나는 여러 연구에서 비교 가능성에 대해 당신의 요점을 취하지 만, 특정 연구 내에서 요인 점수가 그들에게 많은 영향을 미친다고 생각합니다.

흥미로운 점은 2 요인 모델이 적용되거나 더 높거나 공분산 구조가 요인 모델이 예측하는 것보다 복잡하기 때문에 1 요인 모델이 적합하지 않은 경우입니다. 나에게 질문은 변수의 직선 총계가 실제를 참조하는지 여부입니다.. 데이터에 둘 이상의 차원이있는 경우 특히 그렇습니다. 실제로, 종종 발생하는 일은 여러분이 한 두 가지 관련 변수와 다른 관련 변수 (조사 항목)를 가지고 있다는 것입니다. 당신은 "이것으로 지옥에"라고 말할 수 있고, 그것이 의미하는 바에 관계없이 모든 것을 평균화 할 수 있습니다. 또는 요인 점수를 사용할 수 있습니다. 단일 요인 모형에 적합 할 경우 일반적으로 발생하는 요인은 요인 분석이 덜 유용한 변수 (또는 적어도 두 번째 요인 점수에 속하는 변수)의 무게를 줄입니다. 실제로 다른 차원에 속하는 것으로 인식하고 무시합니다.

따라서 요인 점수는 데이터를 정리하여 시작한 것보다 더 일차원적인 것을 줄 수 있다고 생각합니다. 그러나 나는 이것에 대한 언급이 없으며,이 접근법을 좋아한다면 여전히 내 작품에서 알아 내려고 노력하고 있습니다. 나에게, 동일한 데이터를 가진 다른 모델로 점수를 쟁취하면 큰 위험이 과적 합입니다. 점수는 이미 최적화 질문에 대한 답변이므로 나머지 분석은 어디에 있습니까? 나는 생각하기 싫어.

그러나 하루가 끝날 때, 단일 요인 모델과 같은 것이 적용 되지 않으면 합계 또는 총 변수가 실제로 의미가 있습니까?

사람들이 처음에 더 나은 스케일을 설계했다면 이러한 많은 질문은 일어나지 않을 것입니다.


귀하의 의견에 감사드립니다, @Placidia. 당신은 우리에게 더 큰 혼란을 상기시키면서 약간의 명확성을 가져옵니다! "인자 모형이 적합하면 요인 점수가 잠재 요인을 추정합니다. 모든 관측치가 요인에 동일하게 적용되지 않는 한 매니페스트 변수의 직선 또는 평균은 다른 것을 추정합니다. 독창성도 동일합니다. 그리고 다른 것들은 아마도 이론적으로 큰 관심거리가 아닐 것입니다. "
Eric Green

매우 신중한 답변을 위해 +1. 추가 할 몇 가지 생각 : 1) 여러 연구에서 비교 가능성과 관련하여, 모델에서 포함 / 제외 된 변수에 따라 상당히 변할 수있는 구성 요소로드와는 달리 공통 요소로드는 모수 추정치라는 점을 인식하는 것이 중요합니다. 결과적으로, 그들은 연구에서 연구로 (샘플링 오류 내에서) 복제해야하므로 요인 점수도 마찬가지입니다. 2) 요인 점수 사용에 관심이있는 경우 결정 지수와 요인 점수 상관 관계가 잠재적 상관 관계를 얼마나 잘 반영하는지 확인할 수 있습니다.
jsakaluk

1
... 이것이 DiStefanno et.에서 논의 된 전략이라고 생각합니다. 알. 요인 점수를 "신뢰할 수 있는지"평가할 수있는 용지. 그리고 마지막으로 3) Placidia가 설명 하듯이 목표가 대체로 일차원적인 것을 분석하는 것이라면, 이중 요인 분석 접근법을 고려할 수 있습니다. 모든 변수를 함께 묶는 공통 차원을 넘어서 가장 중요한 식별 가능한 요소를 표면적으로 반영하는 변수의 하위 집합에 대해 인수가 추출됩니다.
jsakaluk

Placidia, 답을 마지막으로 편집 할 때 표현에 의해 반복해서 자신을 구속합니다 one-factor model. 왜 그런지 궁금합니다. 2 단계 모형 요인 점수에서 estimate the latent factor더 이상 그렇지 않다는 말을하고 있습니까? 왜 그래? 또한, 개발중인 설문지 (Q의 가능성있는 문맥)에서 "일 요인 모델"을 어떻게 정의합니까? 설문지는 단일 요인 / 규모이거나 포함 된 각 항목이 하나의 요인에 엄격하게 포함된다는 것입니다 /규모? 좀 더 명확하게 해주시겠습니까?
ttnphns

잠재적 인 오해를 피하고 싶었습니다. 2 요인 모형을 믿는다면 아마도 요약 총계를 사용하는 것이 불가능할 것입니다. 데이터의 2 차원에 대해 2 개의 요약이 필요합니다. 내 대답은 요약 통계와 단일 요인 모델의 요인 점수 중에서 선택하는 것에 관한 것임을 명확히하고 싶었습니다. 모델이 잘못된 경우에도 단일 요인 점수가 유용 할 수 있다고 주장합니다. @jsakaluk의 다 인자 모형 적합과 첫 번째 요인 선택에 대한 제안도 가능하며 경우에 따라 더 좋을 수도 있습니다.
Placidia

4

공통 요인에 의해로드 된 항목을 합산하거나 평균화하는 것은 불변 점수 (해석 요인을 나타내는 구성)를 인식하는 전통적인 방법입니다. 계산 요소 점수 의 "거친 방법"의 가장 간단한 버전입니다 . 이 방법의 요점은 계수 가중치를 점수 가중치로 사용하는 것입니다. 점수를 계산하기위한 정제 된 방법은 특별히 추정 된 점수 계수 ( 부하 로부터 계산 )를 가중치로 사용합니다.

이 답변은 보편적으로 "항목 점수의 일반 합계에 대해 [정제 된] 요인 점수를 언제 사용할 지에 대해 제안하지는 않습니다."는 방대한 영역이지만, 다른 방법 보다 구조를 고려 하는 한 가지 방법을 선호하는 구체적인 확실한 영향 을 보여주는 데 중점을 둡니다. 방법.

Fb1b2F

s1=b1r11+b2r12

s2=b1r12+b2r22

s1s2r12bbb

rr11r22

b1=s2r12s1r1221

b2=s1r12s2r1221

b1b2=(r12+1)(s1s2)r1221.

bsr12b1b2

여기에 이미지 설명을 입력하십시오

여기에 이미지 설명을 입력하십시오

s1s2=0bs1s2b1b2r12

b

s1=.70s2=.45.25

씨. 그것들이 서로 밀접하게 관련되어 있다면, 약한 적재물은 다른 것의 주니어 복제품입니다. 대체물이 더 강하다는 표시에서 약한 지표 / 증상을 세는 이유는 무엇입니까? 많은 이유가 없습니다. 그리고 요인 점수는 그에 맞게 조정됩니다 (단순 합계는 그렇지 않습니다). 다단계 설문지에서 "가장로드 된 항목"은 종종 다른 요소의 항목으로, 더 높은 항목으로로드됩니다. 현재 요소에서이 항목은 요소 점수 계산에서 지금 볼 수 있듯이 제한되어 있습니다.

비. 그러나 아이템이 이전과 동일하게로드 된 상태에서 그 값과 강하게 상관되지 않으면 다른 표시기 / 증상입니다. 그리고 "두 번"으로 계산 될 수 있습니다. 이 경우, 요인 점수는 요인의 다른 실시 예이기 때문에 로딩이 여전히 허용하는 정도로 약한 항목을 존중하려고합니다.

ㅏ. 두 항목은 두 항목을 두 번 계산할 수 있습니다. 즉, 이러한 항목 간의 상관 관계에 관계없이 요인에 의해 유사하고 충분히 높은 부하를 가질 때마다 합산됩니다. (팩터 점수는 너무 밀접하게 연관되지 않았을 때 두 항목에 더 많은 가중치를 추가하지만 가중치는 동일합니다.) 일반적으로 항목이 모두 많이로드 된 경우 중복 항목을 허용하거나 허용하는 것은 무리가 없습니다. 이 방법이 마음에 들지 않으면 (때로는 원할 수도 있음) 수동으로 요인에서 중복을 제거 할 수 있습니다.

여기에 이미지 설명을 입력하십시오

따라서 (최소한 회귀법으로) (정제 된) 요인 점수를 계산할 때 , 작도를 구성하는 변수 중 점수에 미치는 영향에서 " 가치 / 밀어 내기" 음모 가 분명히 나타납니다 . 똑같이 강한 지표는 서로 강한 것을 나타내지 않기 때문에 서로 견딜 수 있습니다. "종료"는 약한 지표가 강한 지표와 강한 상관 관계가있는 경우 발생합니다. 단순 추가 / 평균화에는 "약한 복제본을 밀어 넣기"음모가 없습니다.

이론적으로 그 요소가 "그것"을 나타내는 총체적인 컬렉션이나 "현상"이라는 사실을 경고하는 답변을 참조하십시오 . 따라서 하중과 상관 관계를 염두에 두지 않고 맹목적으로 항목을 합산하는 것은 잠재적으로 문제가됩니다. 반면에 점수를 매기는 요소는 항목의 합계 일 수 있으므로 모든 것이 가중치의 더 나은 개념에 관한 것입니다.


또한 더 일반적이고 추상적 인 거친 또는 합산 방법의 부족에 대해 살펴 보자 .

ba

F^iiFiX1X2a1a2FUb

F^i=b1X1i+b2X2i=b1(Fi+U1i)+b2(Fi+U2i)=(b1+b2)Fi+b1U1i+b2U2i

b1U1i+b2U2iF^iFiUF^Fbvar[b1U1i+b2U2i]F^FbaXF^F

abFF^

F^i=a1X1i+a2X2i= ... =(a1+a2)Fi+a1U1i+a2U2i

baaa


도움을 주신 @ttnphns에게 감사드립니다. 대략 동일한 하중을 가진 품목을 합산하는 것이 합리적입니다 (a). 불행히도, 나는 일차원적인 것으로 추정되는 기존 스케일을 사용할 때 아이템이 동일한 하중을 갖는 것을 발견 한 작업에서 어떤 상황에 처한 적이 없다고 생각합니다.
Eric Green

그래서 저는 하중이 다른 상황에 대한 설명과 항목 간 상관 관계를 검토하라는 제안에 특히 관심이있었습니다. (a)의 "strong"(c) / "strong"상관 관계 (b) 또는 "충분히 높은"로드에 대한 경험 법칙이 있는지 알고 싶습니다.
Eric Green

1
마지막으로,이 질문의 배경은 새로운 비정규 인구 집단에게 규모를 관리 할 때에도 단순한 합 (평균)을 요구하는 "유효한"척도를 사용하는 압도적 인 징계 규범 (적어도 심리학에서는)입니다. 종종 목표는 교차 표본 비교 (보증되지 않더라도)이며, 이는 단순한 합계를 일반적인 접근 방식으로 만듭니다.
Eric Green

관심사 비교가 샘플 내에 있기 때문에 중재 연구는 흥미로운 유스 케이스입니다. 우리는 측정에서 "원시"점수 중 어느 것보다, 특히 척도를 개발 / 정상화하는 데 사용 된 집단 밖에서 척도를 사용할 때 치료 효과 크기에 대해 더 관심이있는 것 같습니다. 일부 상황에서 요인 점수가 "더 나은"경우에는 궁극적으로 치료 효과 크기 만보고자한다는 사실을 알기 때문에보다 개념적으로 이해할 수있는 간단한 접근 방식을 사용하는 것이 좋습니다.
Eric Green

1
(계속) Use "validated" scales자체가 반드시 간단한 합계를 요구하지는 않습니다 . 유효성이 좋으면 (대표적 표본이 많고, 상관 관계가 높고, 계수가 정확하고 적합 함 등) 계산 된 요인 점수 (계수)가 표준으로 간주 될 수 있습니다. 새로운 인구에 사용될 가중치. 에서 존경, 나는 단순 합계에 어떤 이점을 볼 수 없습니다.
ttnphns
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.