요인 분석, 내부 일관성 및 항목 반응 이론을 함께 사용하여 항목 수를 줄이는 방법은 무엇입니까?


12

나는 경험적으로 설문지를 개발하는 과정에 있으며이 예에서는 임의의 숫자를 사용하여 설명 할 것입니다. 문맥 상, 나는 불안 장애가있는 개인들에게서 일반적으로 확인되는 사고 패턴을 평가하는 것을 목표로하는 심리적 설문지를 개발하고 있습니다. 항목이 " 오븐이 꺼져 있는지 확인할 수 없기 때문에 오븐을 반복해서 확인해야합니다 "처럼 보일 수 있습니다 .

하나 또는 두 가지 요소로 구성 될 수있는 20 개의 질문 (5 점 리 커트)이 있습니다 (실제로 200 개의 질문에 가깝고 10 개의 척도로 구성되며 각 척도는 두 가지 요소로 구성 될 수 있습니다). 두 가지 요소 중 하나에 10 가지 질문을 남기고 항목의 약 절반을 지우고 싶습니다.

탐색 적 요소 분석 (EFA), 내부 일관성 (Cronbach 's alpha) 및 항목 응답 이론 (IRT)의 항목 특성 곡선에 익숙합니다. 이러한 방법 중 하나를 사용하여 단일 척도 내에서 "더 나쁜"항목을 결정하는 방법을 알 수 있습니다. 비슷한 방법으로 결과가 나올 수 있지만 각 "방법"이 가장 중요한지 확실하지 않지만 각 방법마다 다른 질문에 답변합니다.

시작하기 전에 이러한 각 방법으로 수행하는 작업을 개별적으로 알아야합니다.

  • EFA를 사용하여 요인 수를 식별하고 각 요인에 가장 적게 적재되거나 (<.30이라고 함) 실질적으로 여러 요인에 걸쳐 하중을 가하는 품목을 제거합니다.

  • 내부 일관성을 사용하여 "항목이 삭제 된 경우 알파"가 더 나쁜 항목을 제거합니다. 내 규모에서 한 가지 요소를 가정하거나 초기 EFA 후에 요소 수를 식별하고 각 요소에 대해 내 알파를 실행하기 위해 수행 할 수 있습니다.

  • IRT를 사용하여 (5 Likert) 응답 옵션에 따라 관심 요소를 평가하지 않는 항목을 제거했습니다. 나는 눈알 항목 특성 곡선이 될 것입니다. 기본적으로 Likert 척도의 옵션 1에서 잠재 점수를 따라 최대 5까지 45도 각도의 선을 찾고 있습니다. 하나의 요소를 가정하거나 초기
    EFA 이후에 여러 요소를 식별 한 후 각 요소에 대한 곡선을 실행할 수 있습니다.

"최악의"항목을 가장 잘 식별하기 위해 어떤 방법을 사용해야하는지 잘 모르겠습니다. 나는 아이템이 신뢰성이나 타당성 측면에서 측정에 해를 끼치도록 광범위하게 최악을 사용한다. 둘 다 나에게 똑같이 중요하다. 아마 나는 그것들을 함께 사용할 수는 있지만 어떻게 잘 모르겠습니다.

내가 지금 아는 것을 계속 진행하고 최선의 기회를 주려면 다음을 수행하십시오.

  1. 여러 요인을 식별하기 위해 EFA를 수행하십시오. 또한 다른 분석에서 수행하는 방식에 관계없이 잘못로드되는 항목을 원하지 않기 때문에 각 요인에 대해 잘못로드 된 항목을 삭제하십시오.
  2. EFA에 남아있는 경우 IRT를 수행하고 해당 분석으로 판단 된 불량 항목을 제거하십시오.
  3. 간단히 Cronbach의 알파를보고하고 해당 측정 항목을 항목 삭제 수단으로 사용하지 마십시오.

일반적인 지침은 대단히 감사하겠습니다!

다음은 대답 할 수있는 특정 질문의 목록입니다.

  1. 요인 로딩을 기준으로 항목을 제거하고 Chronbach의 알파를 기준으로 항목을 제거하는 것 (두 분석 모두에 동일한 요인 레이아웃을 사용한다고 가정)의 실제 차이점은 무엇입니까?

  2. 먼저 무엇을해야합니까? 하나의 요소로 EFA와 IRT를 수행한다고 가정하고 둘 다 제거해야 할 다른 항목을 식별한다고 가정하면 어떤 분석이 우선해야합니까?

Chronbach 's alpha에 관계없이보고 할 것이지만, 나는이 모든 분석을 수행하기가 어렵지 않습니다. IRT를하는 것만으로도 뭔가 빠진 것이있을 수 있으며 EFA에서도 마찬가지입니다.


FA를 통해 구성 유효성을 달성하기로 선택했다면 물론 FA로 시작해야합니다 (예 : 배가 치우친 분포와 같이 "나쁜"항목을 선별 한 후). FA와의 관계는 복잡하고 반복적입니다. 대부분의 "약한"항목을 버린 후 FA를 다시 실행하고 KMO 지수, 상관 관계 복원 정도, 요인 해석 가능성, 삭제할 항목이 더 있는지 확인한 후 다시 실행
ttnphns


1
"항목을 제거한 경우 알파"가 가장 높은 항목을 가장 낮게 제거합니다.

이상하다! 이 기본 질문에 관해서는 3 년 내에 인정 된 답변이 없습니다.
WhiteGirl

답변:


3

인용이 없지만 다음은 제안하는 내용입니다.

제로 : 가능한 경우 데이터를 학습 및 테스트 세트로 분할하십시오.

먼저 EFA를 수행하십시오. 질문에 대한 지식을 바탕으로 다양한 솔루션을 통해 어떤 솔루션이 적합한 지 확인하십시오. 당신은 Cronbach의 알파보다 먼저 이것을해야하거나, 어떤 항목이 어떤 요소에 들어가는 지 알 수 없습니다. (모든 항목에서 알파를 실행하는 것은 좋지 않습니다.)

그런 다음 알파를 실행하고 각 요인에서 다른 것보다 훨씬 나쁜 상관 관계가있는 항목을 삭제하십시오. 나는 임의의 컷오프를 설정하지 않고 다른 것보다 훨씬 낮은 것을 찾습니다. 삭제하는 것이 의미가 있는지 확인하십시오.

마지막으로, IRT에서 다양한 "난이도"수준을 가진 항목을 선택하십시오.

그런 다음 가능하면 테스트 세트에서 다시 시도하지만 탐색하지 마십시오. 즉, 훈련 세트에서 찾은 결과가 테스트 세트에서 얼마나 잘 작동하는지 확인하십시오.


답변 해주셔서 감사합니다. 이것은 내가 생각했던 방향을 따르지만 데이터를 분할 할 경우가 있는지 확실하지 않습니다. 또한 항목이 5 포인트 리 커트 스케일에 있기 때문에 대부분 또는 적어도 "좋은 것"도 비슷한 어려움을 겪을 것으로 예상됩니다.
Behacad

1
분명히, 당신은 좋은 참고 문헌을 알고 있습니다 :-) 나는 다음 요점에 대해 당신을 애타게 할 것입니다 (이 스레드는 향후 질문에 대한 참조로 사용될 것이므로). (a) 일반적으로 Cronbach의 알파를 기반으로 한 항목 삭제는 교차 유효성 검사 체계를 고려하지 않고 수행됩니다. 분명히, 동일한 개인이 두 측정 값을 추정하는 데 사용되므로 편향된 접근 방식입니다. (b) 또 다른 대안은 휴식 점수 (즉, 고려중인 항목을 포함하지 않은 합계 점수)를 고려하여 항목 / 규모 상관을 기본으로하는 것입니다.이 경우에 문제가 있다고 생각하십니까? (...)
chl

1
(...) (c) 마지막으로, IRT 모델은 종종 항목 적합 통계 등에 기초하여 ( 정제 정화 의 정신으로) 항목을 버리는 데 사용됩니다 . 그 접근법에 대한 당신의 의견은 무엇입니까?
chl

참고로 이러한 각 방법에 대한 참조를 개별적으로 찾을 수는 있지만 이러한 방법 중 하나를 함께 사용하는 것에 대한 잠재적 인 참조를 부탁드립니다. 모든 참조는 정말 좋을 것입니다! 당신은 아마 (그리고 아마!) 리뷰어를 알고 있습니다.
Behacad

@chl 참조를 파낼 수는 있지만 내 머리 꼭대기에서 알 수는 없습니다. a)와 b)에서 아마도 대부분의 사람들이 생각하는 것보다 더 중요 할 것입니다. 누군가 시뮬레이션을해야합니다. c) IRT 일을 한 이후로 오랜 시간이 걸렸습니다.
Peter Flom-Monica Monica 복원

2

제안 된 세 기준 모두 실제로 IRT,보다 구체적으로 다차원 IRT에서 수행 될 수 있습니다. 표본 크기가 상당히 크면 각 하위 척도에 대해 일관된 방법 일 것입니다. 이러한 방식으로 독립적으로 품목을 모델링 할 때 IRT의 이점을 얻을 수 있습니다 (일부 품목에 대해 명목 모델 사용, 일반 부분 크레딧 또는 다른 등급에 대해 등급 매김, 또는 가능하면 다 항적 항목을보다 포용적인 방식으로 해석하도록 등급 척도 설정).

MIRT는 개념적으로 항목 수준 요인 분석과 동일하므로 이분법 및 다원 항목에 대해 선형 EFA 등가 관계를 갖습니다. 항목과 관련하여 <.3 기준을 구매할 것인지는 확실하지 않습니다. 문맥과 요인 구조에 따라 달라지기 때문입니다. 작은 하중 / 기울기는 절편 위치에 대한 정보를 많이 제공하지는 않지만 수준에서 더 넓고 덜 정점 화 된 정보 기능을 제공 할 수 있기 때문에 여전히 유용 할 수 있습니다 . CAT의 일부 애플리케이션은 이러한 유형의 항목을 조기에 사용하므로 테스트 초기에 더 많은 정보를 제공합니다.θ

Cronbach 기준에 따라 항목을 삭제하는 것은 IRT에서 더 나은 한계 / 임시 안정성을 제공하는 항목을 삭제하는 것과 거의 동일하므로 사용중인 소프트웨어가 이러한 통계를 지원하는 경우 IRT 패러다임을 남기지 않고도 동일한 전략을 따를 수 있습니다. 그러나 정보 기능을 확인하여 항목을 제거하면 다양한 레벨 (절편이있는 위치와 관련) 의 측정에 심각한 영향을 미치는지 확인 하려고합니다. 상대 정보 도표도 여기에 유용합니다.θ

대부분의 IRT 소프트웨어의 일차원 요구 사항을 준수하지 않는 항목을 제거하려고 시도 할 수 있지만, 해당 구성의 이론적 표현에 영향을 미치는 경우 반드시 권장하지는 않습니다. 경험적 응용에서는 일반적으로 모델이 다른 방식이 아닌 이론에 적합하도록 시도하는 것이 좋습니다. 또한 다차원 성을 체계적이고 이론적으로 바람직한 방식으로 설명하면서 가능한 모든 항목을 포함시키려는 경우 이중 요인 / 이중 모형이 적합한 경향이 있습니다.


감사! IRT의 경험적 신뢰성을 어떻게 측정합니까? 이것은 정보와 동일합니까?
Behacad

정확히 말하면 CTT 비율 를 형성하기 위해 '진정한 점수'추정치 ( )와 관련 표준 오류를 얻는 방법에 대한 기능입니다 . 예를 들어 EAP 점수를 계산하는 경우이 정보를 사용하여 분산과 와 표준 오차의 분산 사이의 비율을 형성 할 수 있습니다 . 패키지는 그것의이 작업을 수행 할 기능, 그래서 것이다 패키지 (또는 어쩌면이의 패키지 .... 나는 기억하지 수, 그것은 모두 동일 저자의). RXX=T를/(T+E)θθ^rxx=T/(T+E)θmirtfscores()sirtTAM
Philchalmers

@ philchalmers, pls는 당신이 그것에 대답 할 수 있다면 봐 질문을 가져가 라 .
WhiteGirl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.