게시 된 리 커트 규모의 항목 수를 유효하게 줄일 수 있습니까?


11

[피드백-에 대한 답변으로 수정 된 내용 :-)]

도! 더 많은 편집! 죄송합니다!

안녕하세요-

사기 및 기타 문제에 관한 출판 규모를 사용하여 의료진에게 보낸 설문 조사를 통해 다소 거칠고 준비된 데이터 수집을 수행하고 있습니다.

유일한 것은 조사에서 다른 모든 것들과 함께 규모가 다소 길다는 것입니다. 각 하위 규모를 반으로 줄이고 항목의 절반 만 사용하여 크기를 줄이고 싶습니다. 저의 직감은 하위 규모가 상호 연관되어 있기 때문에 이것이 훌륭하다는 것입니다. 게시 표준 연구에는 적합하지 않지만 약간의 조직 내 사실 찾기에 대해서는 괜찮습니다.

누군가 가이 일, 함정 또는 다른 일의 타당성에 대해 어떤 생각을 가지고 있는지 궁금했습니다. 동료들이 좀 더 설득력이 필요할 것이기 때문에 특히 감사의 말을 전합니다!

많은 감사, 크리스 B

수정

네, 그것은 알려진 심리학 적 특성을 가진 검증 된 스케일입니다.

일차원 적이며 하위 스케일을 가지고 있습니다.

아이템 레벨이 아닌 서브 스케일과 토탈에서 작업 할 것입니다.

30 개 항목, 아마도 약 40-60 명.

건배!


알려진 심리학 적 특성을 가진 검증 된 척도입니까?
chl

안녕하세요 크리스, 그래서 당신은 리 커트 척도에서 항목의 수를 줄이지 않고 질문 / 아이템을 적게 사용합니다 (리 커트 척도에서 측정되는). 일반적으로 측정 값에 따라 달라집니다. 보관하려는 품목과 보관하려는 품목의 상관 관계를 확인할 수 있습니다. 실제로 얼마나 제거해야하는지 측정하는 방법이 흥미 롭습니다. 질문을 그런 식으로 다시 구성하는 것이 좋습니다 (그렇지 않으면 나중에 할 수도 있음). 좋은 질문 :)
탈 Galili

세 가지 추가 질문 : (1) 이것은 일차원적인 척도입니까, 아니면 몇 개의 하위 척도입니까, (2) 개인 및 품목 수는 무엇입니까, (3) 품목의 수준 또는 총계에서 일하십니까? 아니면 평균 점수?
chl

답변:


11

여전히 일부 정보가 부족하지만 (하위 규모 당 개인 및 항목 수) 규모 축소에 대한 일반적인 힌트는 다음과 같습니다. 또한 설문 수준에서 일하고 있기 때문에 왜 그 길이가 그렇게 중요한지 알지 못합니다 (결국 총점 또는 평균 점수와 같은 요약 통계를 제공합니다).

나는 (a) 사기와 관련된 일부 구성을 측정하는 K 항목 세트를 가지고 있다고 가정합니다. (b) "일차원 적"척도는 다른면으로 세분 될 수있는 2 차 요인입니다. (c) 척도의 컨텐츠 유효성을 유지하면서 충분한 정확도의 대상체의 총 척도 점수로 요약 할 수 있도록 척도를 k <K 항목으로 줄이십시오.

이 검증 된 척도의 내용 / 구조 유효성대하여 : 관심있는 구성을 가장 잘 반영하기 위해 항목의 수가 확실히 선택되었습니다. 설문지를 줄임으로써 실제로 구조물 범위를 줄일 수 있습니다. 항목의 절반 만 고려할 때 요인 구조가 동일하게 유지되는지 확인하는 것이 좋습니다 (결국 선택 방식에도 영향을 줄 수 있음). 이것은 전통적인 FA 기술을 사용하여 수행 할 수 있습니다. 당신은 저자와 비슷한 정신으로 척도를 해석 할 책임이 있습니다.

점수 신뢰도 정보 : 표본 종속적 측정 방법이지만 항목 수를 줄이면 점수 신뢰도가 감소합니다 ( Spearman-Brown 공식 참조 ). 또 다른 방법은 표준 측정 오차 (SEM)가 증가하지만 Leo M Harvill 의 표준 측정 오차에 대한 NCME 교육 모듈을 참조하십시오 . 말할 것도없이, 그것은 아이템의 수에 의존하는 모든 지표에 적용됩니다 (예를 들어, Cronbach의 알파는 한 형태의 신뢰성, 즉 내부 일관성을 추정하는데 사용될 수 있습니다). 원점수에 기반한 그룹 간 비교에는 영향을 미치지 않기를 바랍니다.

따라서 내 권장 사항 (가장 쉬운 방법)은 다음과 같습니다.

  1. 시공 범위를 극대화 할 수 있도록 품목을 선택하십시오. FA로 치수를 확인하고 일 변량 반응 분포로 범위를 확인하십시오.
  2. 이전에보고 된 것과 평균 항목 간 상관 관계를 비교하십시오.
  3. 풀 스케일 및 컴포지트에 대한 내부 일관성을 계산하십시오. 그들이 원래의 규모로 출판 된 통계와 일치하는지 확인하십시오 (아무것도 테스트 할 필요가 없습니다. 이는 샘플 의존적 측정입니다).
  4. 원래 점수와 줄어든 (보조) 점수 간의 선형 (또는 다항식 또는 순위) 상관 관계를 테스트하여 비교할 수 있는지 확인합니다 (즉, 잠재적 특성의 개별 위치가 원시 점수를 통해 객관적으로 변하지 않는지 확인). );
  5. 외부 주제별 변수 (예 : 성별, 연령 또는 사기와 관련된 최상의 척도) 가있는 경우 두 양식 간의 알려진 그룹 유효성을 비교 하십시오.

어려운 방법은 잠재적 반응에 대한 최대 정보를 담고있는 항목을 선택하기 위해 항목 응답 이론 에 의존하는 것입니다. 규모 축소는 실제로 가장 적합한 응용 프로그램 중 하나입니다. 다항 항목에 대한 모델은이 스레드, 설문 조사 유효성 검사 에 부분적으로 설명되어 있습니다.

두 번째 업데이트 후 업데이트

  1. 주제가 거의없는 다항 항목에 대한 IRT 모델은 잊어 버리십시오.
  2. 요인 분석은 또한 이러한 낮은 표본 크기로 인해 어려움을 겪을 것입니다. 신뢰할 수없는 팩터 로딩 추정값을 얻을 수 있습니다.
  3. 30 개의 항목을 2 = 15 개의 항목으로 나눈 값 (총 점수에 대한 해당 SEM의 증가를 쉽게 알 수 있음)이지만 하위 척도를 고려하면 결정적으로 나빠질 것입니다 (실제로 두 번째 질문 인 No. 하위 스케일에 따라)

8

귀하의 질문에 명확한 "예 / 아니오"답변이없는 것 같습니다. 하위 설문지에서 항목을 임의로 삭제하여 원래 설문지의 짧은 양식을 작성하면 긴 양식의 심리적 유효성 검증이 손실됩니다. 변경할 수있는 것은 설문지의 계승 구조, 하위 척도의 신뢰도, 항목-총 상관 관계 등입니다. IRT가 아니라 고전적인 테스트 이론 사고에 익숙하다는 것을 알 수 있습니다. 또한 원본 설문지의 표준화를 사용할 수 없습니다. 이것이 바로 짧은 형태의 기존 설문지가 별도의 검증 단계를 거쳐야하는 이유입니다.

그러나 요구 사항에 따라 모든 것이 손실되지는 않습니다. 참조 모집단과 관련하여 "절대"판단을하지 않고 샘플 내 결과 만 비교할 수 있기 때문에 표준화가 필요하지 않을 수 있습니다. IMHO, 최소한 그룹의 하위 표본에 대해 짧은 양식을 원본 양식으로 검증 할 기회가 있다면 더할 나위없이 좋습니다. 결과가 비슷한 지 확인할 수 있습니다.

그러나 일반적으로 설문지에 대한 결과는 놀랍게도 항목 구성에 민감 할 수 있습니다. 사람들은 로봇 식으로 설문지를 작성하지 않고 모든 종류의 암묵적인 가정과인지 적 추론을합니다. "이것이 실제로 무엇입니까?", "내가 여기에 무엇을보고해야합니까?", "실제로 알고 싶은 것은 무엇입니까?" 이것은 주어진 항목의 맥락에 의해 크게 영향을받을 수있다, cf. Schwarz, N. 1996. 인식과 의사 소통 : 판단 적 장애, 연구 방법 및 대화의 논리. Mahwah, NJ : Lawrence Erlbaum.


4

한 점을 추가하겠습니다.

그룹 (예 : 시간이 지남에 따라 그룹 평균 비교)과 개별 레벨 측정 (예 : 스케일의 점수를 개별 레벨의 다른 스케일과 상관 관계)과의 구분에 유의하십시오.

안정성은 두 수준에 다르게 적용됩니다. 아마도 다음과 같은 단순화가 도움이 될 것입니다.

  • 그룹 수준 측정의 신뢰성은 참가자 수와 그룹 수준의 실제 변동성 정도에 크게 영향을받습니다.
  • 개인 수준 측정의 신뢰성은 보유한 품목의 수와 개인이 실제로 변하는 정도에 크게 영향을받습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.