두 공분산 행렬 결합


11

분포의 공분산을 병렬로 계산하고 분포 결과를 단일 가우시안으로 결합해야합니다. 두 가지를 어떻게 결합합니까?

두 작품이 비슷하게 분포되고 크기가 조정되면 두 작품 사이의 선형 보간.

Wikipedia 는 조합에 대한 하단에 포럼을 제공하지만 옳지 않은 것 같습니다. 두 개의 동일하게 분포 된 분포는 동일한 공분산을 가져야하지만 페이지 하단의 공식은 공분산을 두 배로합니다.

두 행렬을 결합하는 방법이 있습니까?


3
Wikipedia 공식은 귀하의 질문에 대답합니다. Matt : 그 후에는 표본 크기로 나눌 필요가있는 부분 공식이라는 것을 알지 못할 수 있습니다.
whuber

1
나는 지금 당신의 도움으로 이것을 알아 냈습니다. 이것을 대답에 넣으면 대답으로 표시합니다.
Matt Kemp

답변:


12

이 질문은 다양한 형태로 많이 등장합니다. 그들에게 공통적 인 것은

분리 된 데이터 하위 집합에서 계산 된 모멘트 기반 통계를 결합하려면 어떻게해야합니까?

가장 간단한 응용 프로그램은 두 그룹으로 분할 된 데이터와 관련이 있습니다. 당신은 그룹 크기와 그룹 평균을 알고 있습니다. 이 네 가지 수량만으로 데이터의 전체 평균은 얼마입니까?

다른 응용은 평균에서 분산, 표준 편차, 공분산 행렬, 왜도 ​​및 다변량 통계로 일반화합니다. 여러 하위 그룹의 데이터가 포함될 수 있습니다. 예를 들어, 표준 편차는 첫 번째와 두 번째 모멘트 (평균 및 평균 제곱)의 2 차 조합의 제곱근입니다.

모든 이러한 경우는 쉽게로 다양한 순간을 줄여 처리 , 합계 가 추가됩니다 금액 분명하고 쉽게 결합 때문이다. 수학적으로,이 내린다 :는 데이터의 배치를 크기의 분리 된 그룹들로 분리 된 J 1 , J 2 , ... , J의 g : ( X 1 , X 2 , ... , X의 J 1 ;엑스=(엑스1,엑스2,,엑스)제이1,제이2,,제이 . 하자 통화 I 번째 그룹 X ( I ) = ( X J I + 1 , X J I + 2 , ... , X의 j 개의 I(엑스1,엑스2,,엑스제이1;엑스제이1+1,,엑스제이1+제이2;엑스제이1+제이2+1,;;,엑스)나는. 정의에 따르면,모든 데이터 배치의k번째모멘트y1,,yjk번째 거듭 제곱의 평균입니다.엑스(나는)=(엑스제이나는+1,엑스제이나는+2,,엑스제이나는+1)케이와이1,,와이제이케이

μ케이(와이)=(와이1케이+와이2케이++와이제이케이)/제이.

분명히 k 번째 거듭 제곱 의 합입니다 . 따라서 이전의 데이터를 g 개의 하위 그룹 으로 분해하는 것을 참조하면 n 의 합을 합의 그룹으로 나눌 수 있습니다.제이μ케이(와이)케이

nμk(X)=(x1k+x2k++xnk)=(x1k+x2k++xj1k)++(xj1++jg1+1k+xj1++jg1+2k++xnk)=j1μk(X(1))+j2μk(X(2))++jgμk(X(g)).

나누면 부분 군 의 k 번째 모멘트와 관련하여 전체 배치의 k 번째 모멘트를 나타냅니다.케이케이

본 출원에서, 공분산 행렬의 엔트리는 물론 공분산이며, 이는 다변량 제 2 순간 및 제 1 순간으로 표현 될 수있다. 계산의 핵심 부분은 다음과 같습니다. 각 단계에서 다변량 데이터의 두 가지 특정 구성 요소에 중점을 둡니다. y 라고합시다 . 당신이보고있는 숫자는 형태입니다엑스와이

((엑스1,와이1),(엑스2,와이2),,(엑스,와이)),

이전과 같이 그룹으로 나습니다. 각 그룹에 대해 x i y i 의 곱의 평균 합을 알 수 있습니다 . 이것은 ( 1 , 1 ) 다변량 모멘트 μ ( 1 , 1 ) 입니다. 이러한 그룹 값을 결합하려면 그룹 크기를 곱하고 결과를 더한 다음 합계를 n으로 나눕니다 .엑스나는와이나는(1,1)μ(1,1)

이 접근법을 적용하려면 미리 생각해야 합니다. 공분산과 부분 군 크기 알고있는 경우 공분산을 결합 할 수 없습니다 . 또한 부분 군의 평균도 알아야합니다 (수단이 필수적인 방식으로 관련되어 있기 때문에) 모든 공분산 공식에서) 또는 대수적으로 수단에 환원 가능한 것입니다. 또한 수식에 나타나는 상수와 관련하여주의를 기울여야 할 수도 있습니다. 조심성 최고 트랩 (나눈 제품의 합 관련된 "샘플 공분산"혼동하는 (분할에 의해 인 "모집단 공분산"로) N을 ). 이것은 새로운 것을 소개하지 않습니다. 당신은 단지에 의해 샘플 공분산을 곱 기억해야 N -1n (또는 j i )이아니라 합을 복구하려면 1 (또는 j i - 1으로 그룹 공분산)하십시오.1제이나는1제이나는


아, 그렇습니다. 현재의 질문에 대해. Wikipedia 기사에 제공된 공식은 그룹 평균 (첫 번째 순간) 및 그룹 의 제품 합계 측면 에서 제공됩니다. 위에서 설명한 것처럼 이들을 더한 다음 나누기로 결과를 조정하여 공분산을 얻습니다. 에 의한 최종 나눗셈 은 표시되지 않습니다.


나는 k 번째 순간의 정의에 대해 약간 혼란스러워합니다. 평균 데이터가 0이라고 가정합니까?
reschu

케이

나쁘다! 나는 '중앙'과 '원시'순간을 섞고있었습니다. 설명 주셔서 감사합니다!
reschu

두 번째 단락의 "하위 그룹 크기의 수단을 아는 것"은 "하위 그룹의 수단을 아는 것"을 대신 읽어야한다고 생각합니까? (대답을 매우 신중하게 연구하지 않으니 주저하지 말고 직접 수정하십시오)
Juho Kokkala

@ Juho 당신은 꽤 정확합니다. 그것을 알아 주셔서 감사합니다!
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.