교차 공분산 행렬이 0이 아닌지 테스트하는 방법은 무엇입니까?


11

내 연구의 배경 :

깁스 샘플링에서 어디 샘플 X (관심의 가변) 및 Y 에서 P(X|Y)P(Y|X) 는 각각 XY 있는 k 차원 랜덤 벡터. 프로세스는 일반적으로 두 단계로 나뉩니다.

  1. 모든 샘플을 폐기하는 번인 기간. 샘플은 X1Xt 로 나타냅니다 Y1Yt.
  2. 샘플을 평균화하는 "애프터 번인"기간 X¯=1ki=1kXt+i는 최종 결과입니다.

그러나, "애프터-번-인"시퀀스 의 샘플은 Xt+1Xt+k독립적으로 분포되지 않습니다. 따라서 최종 결과의 분산을 검사하려면

Var[X¯]=Var[i=1kXt+i]=1k2(i=1kVar[Xt+i]+i=1k1j=i+1kCov[Xt+i,Xt+j])

여기서 라는 용어 는 k × k 교차 공분산 행렬 이며 i < j 인 임의의 ( i , j )에 적용됩니다 .Cov[Xt+i,Xt+j]k×k(i,j)i<j

예를 들어

Xt+1=(1,2,1)Xt+2=(1,0,2)Xt+3=(1,0,0)Xt+4=(5,0,1)

공분산 행렬 를 추정 할 수 있습니다.Cov[Xt+i,Xt+i+1]

13i=13(Xt+iμt+i)(Xt+i+1μt+i+1)

이제 결과 추정값이 0이 아닌지에 관심이 있으므로 의 분산 추정값에 포함시켜야합니다 .Var[X¯]

그래서 여기 내 질문이 온다 :

  1. 우리 샘플 에서 P ( X t + | Y의 t + I ) . Y t + i 가 변하기 때문에 X t + iX t + i + 1 은 같은 분포에서 나온 것이 아니라 Cov [ X t + i , X t + j ]Cov [ X t 와 같지 않습니다Xt+iP(Xt+i|Yt+i)Yt+iXt+iXt+i+1Cov[Xt+i,Xt+j]. 이 진술이 맞습니까?Cov[Xt+i,Xt+i]
  2. (시퀀스에서 인접 샘플) 를 추정하기에 충분한 데이터가 있다고 가정 하고 공분산 행렬이 0이 아닌 행렬인지 테스트 할 방법이 있습니까? 광범위하게 말해서, 나는 최종 분산 추정에 포함되어야하는 의미있는 교차 공분산 행렬을 안내하는 지표에 관심 이 있습니다.Cov[Xt+i,Xt+i+1]

4
사실, 이것은 지금 꽤 좋은 질문처럼 보입니다. 다른 사람들이 나보다 좋은 답변을 제공하는 것이 더 좋을 것 같아서 곧 자격이 될 때이를 홍보하고 싶습니다 (현상금 지급). [짧은 대답 : 1.이 두 공분산은 다릅니다. 2. 연속 변이가 상관 관계인지 여부 를 테스트 할 필요는 없습니다 (가장 사소한 경우를 제외하고는 알고리즘이 종속 변량을 생성하여 작동 함). 좋은 답변이 표시되지 않습니다 나는 그 짧은 주석을 완전한 답변으로 확장 할 것입니다
Glen_b -Reinstate Monica

4
질문이 제목 질문보다 훨씬 더 넓은 것 같습니다. 제목 문제를 구체적으로 설명하기 위해 Bartlett의 구 형성 검정을 통해 표본 공분산 행렬이 대각선인지 테스트 할 수 있습니다. 교차 공분산 시나리오에 맞게 조정해야 할 수도 있습니다 ( "공분산 행렬"은 실제로 공분산 행렬이 아니며 교차 공분산 행렬이며 X_t 및 X_ { t + 1} 함께). CC에서 @Glen_b로
amoeba

2
공분산은 다소 기하학적으로 쇠퇴하는 경향이 있다고 덧붙일 것입니다. 멀리 떨어져 시간의 값이 매우 낮은 상관 관계를 (하는 경향이 없는 사람들 가깝게 때로는 매우 종속 될 수 있습니다 동안 제로하지만 대부분 무시할 수).
Glen_b-복지 모니카

1
@Tom 1. 그럼에도 불구하고 고정 시리즈로 매우 먼 시차 (4는 멀지 않습니다!)에서 ACF는 어떻게됩니까? 2. MCMC에서 생성 된 값이 임의의 시계열에 대해 말할 수없는 작동 방식에 대해 알고 있습니다 . 이는 Markovian 입니다. 이전의 의견은 가장 가까운 지연이 기하 붕괴를 보여야한다고 주장하지 않습니다 (예 : 3보다 지연 4에서 더 높은 상관 관계를 볼 수 없다고 말하지는 않았습니다). 멀리서 움직일 때 ACF에서 기하 붕괴 경향이 계속 나타납니다 (특정 조건이 유지되는 경우).
Glen_b-복지 주 모니카

2
표본 추출 기간이 너무 짧으면 교차 공분산에 대한 정확한 추정치가없는 경우, 교차 공분산 항의 추정치에 표준 오차가 크게 없다는 사실을 처리해야 할 수도 있습니다. 내 현재 이해가 주어지면 상관 관계 테스트에 대한 이의 제기를 더 강력하게 재확인 할 것입니다. 0 대 0이 아닌 상관 관계에 대한 가설 테스트는 여기서 문제를 해결하지 않습니다.
Glen_b-복지 주 모니카

답변:


1
  1. 우리 샘플 에서 P ( X t + | Y의 t + I ) . 때문에 Y의 t는 + i가 변하고 생각 X t + IX t + I + 1이 동일한 분포하지 [...]Xt+iP(Xt+i|Yt+i)Yt+iXt+iXt+i+1

조건부 배포와 무조건 배포를 혼동하고 있습니다. 다음 비고도 참조하십시오. Y t + i + 1 = y 2의 조건부 , P ( X t + i | Y t + i = y 1 ) P ( X t + i + 1 | Y t + i + 1 = y 2Yt+i=y1Yt+i+1=y2 . 그러나 Gibbs 샘플러를 구성하는 요점은 X Y 의 고정 분포에서 샘플링하는 것입니다. 매우 대략적으로 말하면, 체인을 충분히 오랫동안 운영하여 { Y t } 가 고정 분포를 따르도록하면 P ( X t ) = Y P ( X t | Y t ) d P ( Y t ) , 무조건 X t 분포P(Xt+i|Yt+i=y1)P(Xt+i+1|Yt+i+1=y2)XY{Yt}

P(Xt)=YP(Xt|Yt)dP(Yt),
Xt또한 변하지 않습니다. 다시 말해서, 와 같이 고정 분포에 수렴합니다. P ( X t + i | Y t + i ) = P ( X t + i + 1 | Y t + i + 1 ) , Y t + iY t + i + 1 은 (동일하게!) 고정 분포 P (tP(Xt+i|Yt+i)=P(Xt+i+1|Yt+i+1)Yt+iYt+i+1 . 반면에 이전과 마찬가지로 Y t + i = y 1 Y t + i + 1 = y 2 에 대해 조건을 설정하면 t의 크기에 관계없이 더 이상 유지되지 않습니다.P(Yt)Yt+i=y1Yt+i+1=y2t

[...]를 와 동일하지 COV [ X t + I , X t + I ] . 이 진술이 맞습니까?Cov[Xt+i,Xt+j]Cov[Xt+i,Xt+i]

네, 맞습니다 - 비록 , 즉 X tX t + 1 같은 고정 분포를 가지고있다. 나는 이것이 혼란 스러울 수 있음을 알고 있지만 나에게 견딜 수 있습니다. ε t i i d N ( 0 , 1 )으로 Y t = 0.8 Y t 1 + ε t 를 정의 합니다. 반복 치환에 의해 Y t = Xt+1XtXtXt+1Yt=0.8Yt1+εtεtiidN(0,1), (무한한) 법선의 합은 여전히 ​​정상이므로,Var(Yt)= t i = 0 0.82i=1Yt=i=0t0.8iεti 이므로YtiidN(0,1Var(Yt)=i=0t0.82i=110.82. 분명히YtYt+1은 여전히 ​​상관 관계가 있지만 같은 분포 (Yt+1Yt)에서 나옵니다. Xt에대해서도 비슷한 상황이 있습니다.YtiidN(0,110.82)YtYt+1Yt+1YtXt

  1. (시퀀스에서 인접 샘플) 를 추정하기에 충분한 데이터가 있다고 가정 하고 공분산 행렬이 0이 아닌 행렬인지 테스트 할 방법이 있습니까? 광범위하게 말해서, 나는 최종 분산 추정에 포함되어야하는 의미있는 교차 공분산 행렬을 안내하는 지표에 관심 이 있습니다.Cov[Xt+i,Xt+i+1]

글쎄, 당신이 무한히 많은 관측을했다면, 결국 모두 중요 할 것입니다. 분명히, 당신은 실제로 이것을 할 수는 없지만 몇 가지 용어 후에 확장을 '잘라내는'방법이 있습니다. 여기서 훌륭한 대답을 보십시오. 기본적으로, 당신은 커널 정의 에 붕괴 0 처음에 및 양수인 무게 리터 T의 당신은 계산할 수 공분산 행렬. 원칙적인 방법으로 l T 를 선택 하려면 문헌을 조금 파헤쳐 야하지만, 내가 연결 한 게시물은 정확히 그렇게 할 수있는 좋은 참고 자료를 제공합니다.k()0lTlT

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.