변수 그룹 간 / 그룹 내 상관 관계를 계산하는 방법은 무엇입니까?


13

5 점 척도로 측정 된 1000 개의 관측치와 50 개의 변수로 구성된 행렬이 있습니다. 이러한 변수는 그룹으로 구성되어 있지만 각 그룹에 같은 수의 변수가 없습니다.

두 가지 유형의 상관 관계를 계산하고 싶습니다.

  1. 변수 그룹 내에서의 상관 관계 (특성 중) : 변수 그룹 내의 변수가 동일한 것을 측정하는지 여부에 대한 일부 측정.
  2. 변수 그룹 간의 상관 관계 : 각 그룹이 하나의 전체 특성을 반영한다고 가정하고 각 특성 (그룹)이 다른 모든 특성과 관련되는 방식을 측정합니다.

이러한 특성은 이전에 그룹으로 분류되었습니다. 나는 그룹들 사이의 상관 관계를 찾는데 관심이있다. 즉 그룹 내의 특성이 동일한 기본 특성을 측정한다고 가정 할 때 (위의 1 위 완료-Cronbach의 알파) 특성 자체와 관련이 있는가?

어디에서 시작할지 제안하는 사람이 있습니까?


1
R에 익숙한 경우 vegan기능이 anosim있거나 바람직하게는 adonis(순열 MANOVA) 패키지 가 있습니다 .
Roman Luštrik

표준 용어 (예 : 특성이 아닌 변수, "그룹"이 아닌 변수 그룹)를 사용하도록 질문을 업데이트했습니다.
Jeromy Anglim

답변:


16

@rolando가 제안한 것은 전체 응답 (IMO)이 아니라면 좋은 출발처럼 보입니다. CTT (Classical Test Theory) 프레임 워크에 따라 상관 접근법을 계속 사용하겠습니다. 여기서 @Jeromy가 지적한 바와 같이, 귀하의 특성 그룹에 대한 요약 척도는 이제 내가 척도라고 부르는 것에 속하는 모든 항목 (단어의 특성)의 총 (또는 합계) 점수로 간주 될 수 있습니다. CTT 하에서, 이것은 기초적 구성 (잠재적 특성)을 반영하는 연속적인 규모로 개인의 "특성"성향 또는 책임을 공식화 할 수있게한다. .

설명한 것은 심리 측정의 수렴 (동일한 척도에 속하는 항목이 서로 어느 정도 상관 관계가 있는가)과 판별 (다른 척도에 속하는 항목이 크게 상관되어서는 안 됨 )과 관련이 있습니다. 고전적인 기술에는 MTMM (Multi-trait Multi-method) 분석이 포함됩니다 (Campbell & Fiske, 1959). 작동 방식에 대한 그림이 아래에 나와 있습니다 (세 가지 방법 또는 도구, 세 가지 구성 또는 특성).

여기에 이미지 설명을 입력하십시오

이 MTMM 매트릭스에서 대각선 요소는 Cronbach 's alpha 또는 test-retest intraclass correlation 일 수 있습니다. 이들은 각 측정 스케일 의 신뢰성 을 나타내는 지표입니다 . 가정 된 (공유) 구성 의 유효성 은 다른 도구를 사용하여 동일한 특성을 평가할 때 척도 점수의 상관 관계에 의해 평가됩니다. 이러한 도구가 독립적으로 개발 된 경우 높은 상관 관계 ( )는 특성이 일관되고 객관적인 방식으로 정의된다는 아이디어를 뒷받침합니다. 이 MTMM 매트릭스의 나머지 셀은 방법 내 형질방법 간 특성 간의 관계 요약 합니다.< .3>0.7, 독특한 구성이 다른 척도로 측정되는 방식과 주어진 척도에서 각 특성 간의 관계는 무엇인가를 나타냅니다. 독립적 인 특성을 가정 할 때 일반적으로 이러한 특성이 높을 것으로 기대하지는 않지만 (권장 임계 값은 ),보다 공식적인 가설 검정 (상관 점 추정치)을 수행 할 수 있습니다. 미묘한 점은 소위 "휴식 상관 (rest correlation)"을 사용한다는 것입니다. 즉,이 척도의 합계 점수에 대한이 항목의 기여를 제거한 후 항목 (또는 특성)과 해당 척도 (또는 방법) 사이의 상관 관계를 계산합니다. 겹침).<.3

비록이 방법이 다른 측정 도구에 의해 연구 된 바와 같이 특정 수의 특성의 수렴 및 판별 적 유효성을 평가하기 위해 처음 개발 되었더라도 단일 다중 스케일 도구에 적용될 수 있습니다. 그런 다음 특성이 항목이되고 방법은 다른 척도입니다. 이 방법을 단일 계측기로 일반화하는 것을 다중 특성 스케일링 이라고도 합니다. 예상 한대로 상관 관계가있는 항목 (즉, 다른 스케일이 아닌 자체 스케일과 함께)은 스케일링 성공 으로 계산됩니다.. 그러나 일반적으로 서로 다른 척도는 서로 관련이 없으며, 즉 서로 다른 가설 적 구성을 목표로하고 있다고 가정합니다. 그러나 척도 내 및 스케일 간 상관 관계를 평균하면 계측기의 내부 구조를 요약 할 수있는 빠른 방법을 제공합니다. 이를 수행하는 또 다른 편리한 방법은 쌍별 상관 행렬에 군집 분석을 적용하고 변수가 어떻게 연결되는지 확인하는 것입니다.

참고로 두 경우 모두 상관 관계 측정 작업에 대한 일반적인 경고가 적용됩니다. 즉, 측정 오류를 설명 할 수 없으며 큰 샘플이 필요합니다. 계측기 또는 테스트는 "병렬"인 것으로 가정합니다 (타우 등가, 상관되지 않은 오류, 동일한 오차 분산).

@rolando가 다루는 두 번째 부분도 흥미 롭습니다. 이미 설정된 항목 그룹이 의미가 있다는 이론적 또는 실질적인 표시가 없다면 탐색 적 요소 분석과 같은 데이터 구조를 강조하는 방법을 찾아야합니다 . 그러나 "그룹 내 특성"을 신뢰하더라도 이것이 유효한 가정인지 확인할 수 있습니다. 이제 확인 요인 분석 모델을 사용하여 항목로드 패턴 (자체 척도와 항목의 상관 관계)이 예상대로 작동하는지 확인할 수 있습니다.

전통적인 요인 분석 방법 대신 Cronbach의 알파 기반 분할 규칙을 사용하여 항목을 균질 한 척도로 그룹화하는 항목 군집 (Revelle, 1979)을 살펴볼 수도 있습니다.

마지막 단어 : R을 사용하는 경우 앞에서 언급 한 단계를 쉽게 수행 할 수있는 두 가지 멋진 패키지가 있습니다.

  • 정신 , 당신은 심리 측정 요인 분석을 포함한 방법, (시작하기 위해 필요한 모든 것을 제공 fa, fa.parallel, principal), 항목 클러스터링 ( ICLUST및 관련 방법), 크론 바흐의 알파 ( alpha); William Revelle 웹 사이트에 유용한 개요가 있습니다. 특히 R의 응용 프로그램을 사용한 심리 이론에 대한 소개 입니다.
  • psy 에는 (PCA + 시뮬레이션 데이터 세트를 통한 scree.plot) 가시도 ( mtmm) 및 MTMM ( )이 포함됩니다.

참고 문헌

  1. 캠벨, DT 및 Fiske, DW (1959). multitrait-multimethod 매트릭스에 의한 수렴 및 판별 검증. 심리 게시판 , 56 : 81–105.
  2. Hays, RD and Fayers, P. (2005). 다중 항목 스케일 평가 에서 임상 시험에서 삶의 질 평가 , PP. 41-53을 (Fayers, P. 및 건초, R.를, EDS가.). 옥스퍼드.
  3. Revelle, W. (1979). 계층 적 군집 분석 및 테스트의 내부 구조. 다변량 행동 연구 , 14 : 57-74.

이것은 아마도 거래소에서 읽은 가장 흥미로운 반응 일 것이고 5 년 동안 계량 경제학을 연구 해 왔습니다.
d8aninja

여기에 포함 된 MTMM 매트릭스가 실제 상관 매트릭스의 예라고 가정합니까? 그렇다면 실제로 양의 반 정규 행렬이 아니라는 점에 주목할 것입니다. 예를 들어, 방법 1,2에서 특성 1,2의 상관 관계에 대한 4x4 마이너는 -0.0419179를 결정합니다. (이것은 작은 음수 값이므로, 이것은 아마도 당신의 요점으로갑니다 : '측정 오차')
Semiclassical

7

용어를 읽는 방법, 원하는 것은 먼저 각 변수 그룹 내에서 내부 일관성을 평가 한 다음 각 변수 그룹의 평균을 구성하는 척도 점수 간의 상관 관계를 평가하는 것입니다. 첫 번째는 Cronbach의 알파를 사용하고 두 번째는 Pearson 상관 관계를 사용하여 수행 할 수 있습니다. 이것은 당신이 합리적으로 정규 분포와 합리적으로 선형 관계를 가지고 있다고 가정합니다.

반드시 필요한 것은 아니지만 더 관련있는 방법은 탐색 적 요소 분석을 수행하는 것입니다. 함께 그룹화해야하는 변수를 설정 한 다음 해당 요소가 어느 정도 상호 연관되는지를 확인하려고합니다. 이 방법을 시도하는 경우 경사 회전을 사용하여 이러한 상관 관계가 표시되도록하십시오. 주성분 추출 또는 주축 추출 사용 여부는 각각 변수가 객관적이고 오류가없는 측정인지 또는 일정량의 오류가 포함 된 측량 항목과 같은 주관적인 변수인지에 따라 다릅니다.


답변 주셔서 감사합니다. Cronbach의 알파를 계산했지만이 경우 Pearson 상관 계수를 어떻게 계산합니까? 개별 특성별로 쌍으로 계산할 수 있지만 특성 그룹 간의 상관 관계를 계산하는 방법을 알고 싶습니다. 그룹 내 특성은 각 관측치에 대해 유사한 점수를 갖습니다. 이 질문을 좀 더 명확하게하기 위해 질문을 편집하겠습니다.
blep

5
  • 적어도 당신의 상황에서 심리학의 표준 도구는 요소와 상관 관계 매트릭스의 수렴을 고려한 요소와 항목 사이의 관계 모델을 탐색하기위한 탐색 및 확인 요소 분석입니다. 당신이 당신의 질문을 표현한 방식은 당신이이 문헌에 익숙하지 않다는 것을 암시합니다. 예를 들어, 다음은 스케일 구성 및 요인 분석 에 대한 참고 사항 이며 요인 분석 양식 Quick-R에 대한 R자습서입니다 . 따라서 특정 질문에 대답하는 것이 가치가 있지만 다중 항목, 다중 요인 척도 평가에 대한 요인 분석 방법을 검토하면 더 넓은 목표를 더 잘 달성 할 수 있다고 생각합니다.

  • 또 다른 표준 전략은 각 변수 그룹에 대한 총 점수를 계산하고 ( "스케일"이라고 함) 척도를 상관시키는 것입니다.

  • 많은 신뢰성 분석 도구는 평균 항목 간 상관 관계를보고합니다.

  • 항목간에 50 x 50 행렬의 상관 관계를 만든 경우 변수 그룹의 조합을 기반으로 하위 집합을 평균화하는 함수를 R로 작성할 수 있습니다. 양의 상관 관계가 양의 상관 관계를 취소 할 수 있으므로 양수 항목과 음수 항목이 혼합되어 있으면 원하는 것을 얻지 못할 수 있습니다.


2

상호 정보 개념과 가우시안 모델의 통합 개념에 대해서만 정의되는 상관 관계 개념의 대체물로 사용하는 것이 좋습니다.

가우시안 모델에서 변수 그룹 의 통합 은 그룹의 엔트로피로 정의됩니다.G1

I1log(|C1|)

여기서 은 변수 그룹 의 상관 행렬입니다 . 이 경우 것을 쉽게 알 수있다 단지 2 개 변수로 구성되어, 그 통합은 직접 변수 페어 상관 계수에 관한 것이다 .G 1 G 1 l o g ( 1 ρ 2 ) ρC1G1G1log(1ρ2)ρ

두 변수 그룹 사이의 상호 작용을 계산하기 위해 상호 정보를 사용할 수 있습니다. 그룹 간 상호 엔트로피입니다.

MU12=I12I1I2

빠른 구글 후에 도움이 될 수있는 이러한 개념에 대한 참조 를 찾았 습니다 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.