공분산 행렬이 두 시점에 걸쳐 변경되었는지 테스트하는 방법은 무엇입니까?


13

내 임무는 6 변수의 공분산 행렬에 변화가 있는지 테스트하는 것입니다. 6 개의 변수 값은 동일한 주제에서 두 번 측정됩니다 (측정 사이 3 년).

어떻게해야합니까? SAS를 사용하여 대부분의 작업을 수행했습니다.


답변 주셔서 감사합니다. Box M을 생각하고 있었지만 그것이 반복되는 측정에 적용되는지 확실하지 않았습니다. 그 Rencher의 책을 얻어야했다. SAS의 proc mixed와 같이 중첩 모델 비교를 수행 할 수 있다고 확신합니다. 그럼에도 불구하고, 감사합니다! 나는 여기에 새로 왔고 잘만되면 언젠가 답변도 제공 할 수있을 것입니다 : o)
Janne

사이트에 오신 것을 환영합니다! 감사합니다. 그러나이 사이트에서는 답변으로 제공해서는 안됩니다. 당신이 좋아하는 답을 찬성하고 가장 좋아하는 답을 받아들임으로써 감사를 표할 수 있습니다. 답변에 의견을 추가 할 수도 있습니다. 또한 시도하거나 생각한 것들이 문제를 해결하는 데 도움이 될 수있는 질문을하는 데 도움이됩니다.
mpiktas

답변:


11

분포가 다변량 정규 분포라고 가정하면 (공분산 행렬에 대한 검정은 어쨌든 가정 할 수 있음) 귀무 가설은 두 모집단이 교대에 의해서만 다르다는 것입니다. 평균을 뺀 두 그룹의 데이터에 대한 Kolmogorov-Smirnov 테스트를 사용하여이를 테스트 할 수 있습니다.

Rencher (2002) (7.3.2 절)는 다음과 같이 두 행렬 (Box M-test)을 비교하기위한 우도 비 검정 통계량을 제공합니다.

M=|S1|ν1/2|S2|ν2/2/|Sp|(ν1+ν2)/2

여기서 과 는 두 샘플의 표본 공분산 행렬이고, 는 합동 공분산 행렬이고, 과 는 자유도 (샘플 크기-1)입니다. 무조건 은 자유도를 갖는 분포를 따릅니다. 여기서 는 행렬의 크기입니다. Rencher (2002)는 또한 Bartlett이 수정 한 테스트 버전과 근사값을 제공합니다. 그러나 이것은 반복 측정 테스트가 아닌 2 샘플 테스트이므로 다소 보수적 일 수 있습니다.S1S2Spν1ν22logMχ2p(p+1)/2pF


분포가 다변량 정규가 아닌 경우 공분산 행렬의 동질성에 대한 Box의 M- 검정의 대안은 무엇입니까?

적용 할 수 없다고 말하고 싶습니다. 가능성 비율이 적용 되려면 모든 것이 정상이어야합니다. 그렇지 않으면 모멘트 기반 통계로 이동 한 다음 공분산의 공분산을 얻기 위해 4 차 모멘트가 필요합니다.
StasK

8

구조 방정식 모델링 소프트웨어를 사용할 수 있습니다. 다음은 Amos에서 프로세스가 작동하는 방식에 대한 스케치입니다.

  • 시간 1 ( ) 및 시간 2 ( )에 대한 모든 변수를 추가하십시오X1,...,X6Y1,...,Y6
  • 모든 변수 사이에 양방향 화살표를 그립니다 (즉, 소프트웨어에 모든 분산 및 공분산이 자유롭게 변할 수 있음을 알리므로 모델이 데이터를 완벽하게 표현해야 함)
  • 모든 분산과 공분산의 이름을 지정합니다
  • 위는 모델 1입니다 (즉, 등식 제약 조건 없음)
  • 그런 다음 모형 2에 동등성 문을 추가합니다 (예 : 분산 및 공분산 제한)
    • 평등은 다른 시간 지점에서 변수에 대응하기위한 편차를 : 예를, var_x1 = var_y1 var_x2 = var_y2등등
    • 동일한 시점에 대응 대한 공분산 : 예 cov_x1_x2 = cov_y1_y2 cov_x1_x3 = cov_y1_y3등등
  • 두 모델의 적합성 차이 검사
    • 모델 2는 모델 1 내에 중첩되므로 카이 제곱 차이 테스트와 같은 중첩 모델 비교 테스트를 사용할 수 있습니다.

2

이것은 아마도 proc mixed로 테스트 할 수 있습니다 (다변량 정규성을 가정해야합니다). 모든 데이터를 한 열에 쌓으십시오. 그런 다음 주제 ID 및 시점에 대한 표시기가 필요합니다. 주제 ID와 시점 표시기를 클래스 변수로 정의해야합니다. 절편 만 모형을 적합하십시오. 그런 다음 제약 조건이없는 분산 / 공분산 구조 ( type=un) 에 맞게 반복 된 문장을 사용하십시오 . 아래쪽 쓰기 어디 가능성이다)과 자유도. 그런 다음 두 번째 모형을 적합하지만 이번에는 반복 된 문장에서 옵션을 사용하여 각 시점에 대해 별도의 공분산 구조를 만듭니다 (즉, 각 시점이 그룹 임). 적어 두십시오.2ln(L)Lgroup=SAS2ln(L)그리고 df. 그런 다음 두 모형 사이의 -2loglikelihoods 및 dfs의 차이를 사용하여 적합치 차이가없는 LRT 검정을 수행합니다.이 모형은 두 모형 간의 적합치 차이가 없다는 귀무 가설하에 카이 제곱으로 분산되어야합니다.


@Andres 사이트에 오신 것을 환영합니다. 여기서 LaTeX를 사용할 수 있습니다. 나는 당신의 게시물에서 조금 더 깔끔하게 만들었습니다.
Peter Flom-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.