분포의 공분산을 병렬로 계산하고 분포 결과를 단일 가우시안으로 결합해야합니다. 두 가지를 어떻게 결합합니까?
두 작품이 비슷하게 분포되고 크기가 조정되면 두 작품 사이의 선형 보간.
Wikipedia 는 조합에 대한 하단에 포럼을 제공하지만 옳지 않은 것 같습니다. 두 개의 동일하게 분포 된 분포는 동일한 공분산을 가져야하지만 페이지 하단의 공식은 공분산을 두 배로합니다.
두 행렬을 결합하는 방법이 있습니까?
분포의 공분산을 병렬로 계산하고 분포 결과를 단일 가우시안으로 결합해야합니다. 두 가지를 어떻게 결합합니까?
두 작품이 비슷하게 분포되고 크기가 조정되면 두 작품 사이의 선형 보간.
Wikipedia 는 조합에 대한 하단에 포럼을 제공하지만 옳지 않은 것 같습니다. 두 개의 동일하게 분포 된 분포는 동일한 공분산을 가져야하지만 페이지 하단의 공식은 공분산을 두 배로합니다.
두 행렬을 결합하는 방법이 있습니까?
답변:
이 질문은 다양한 형태로 많이 등장합니다. 그들에게 공통적 인 것은
분리 된 데이터 하위 집합에서 계산 된 모멘트 기반 통계를 결합하려면 어떻게해야합니까?
가장 간단한 응용 프로그램은 두 그룹으로 분할 된 데이터와 관련이 있습니다. 당신은 그룹 크기와 그룹 평균을 알고 있습니다. 이 네 가지 수량만으로 데이터의 전체 평균은 얼마입니까?
다른 응용은 평균에서 분산, 표준 편차, 공분산 행렬, 왜도 및 다변량 통계로 일반화합니다. 여러 하위 그룹의 데이터가 포함될 수 있습니다. 예를 들어, 표준 편차는 첫 번째와 두 번째 모멘트 (평균 및 평균 제곱)의 2 차 조합의 제곱근입니다.
모든 이러한 경우는 쉽게로 다양한 순간을 줄여 처리 , 합계 가 추가됩니다 금액 분명하고 쉽게 결합 때문이다. 수학적으로,이 내린다 :는 데이터의 배치를 크기의 분리 된 그룹들로 분리 된 J 1 , J 2 , ... , J의 g : ( X 1 , X 2 , ... , X의 J 1 ; . 하자 통화 I 번째 그룹 X ( I ) = ( X J I + 1 , X J I + 2 , ... , X의 j 개의 I. 정의에 따르면,모든 데이터 배치의k번째모멘트y1,…,yj는k번째 거듭 제곱의 평균입니다.
분명히 는 k 번째 거듭 제곱 의 합입니다 . 따라서 이전의 데이터를 g 개의 하위 그룹 으로 분해하는 것을 참조하면 n 의 합을 합의 그룹으로 나눌 수 있습니다.
나누면 부분 군 의 k 번째 모멘트와 관련하여 전체 배치의 k 번째 모멘트를 나타냅니다.
본 출원에서, 공분산 행렬의 엔트리는 물론 공분산이며, 이는 다변량 제 2 순간 및 제 1 순간으로 표현 될 수있다. 계산의 핵심 부분은 다음과 같습니다. 각 단계에서 다변량 데이터의 두 가지 특정 구성 요소에 중점을 둡니다. 와 y 라고합시다 . 당신이보고있는 숫자는 형태입니다
이전과 같이 그룹으로 나습니다. 각 그룹에 대해 x i y i 의 곱의 평균 합을 알 수 있습니다 . 이것은 ( 1 , 1 ) 다변량 모멘트 μ ( 1 , 1 ) 입니다. 이러한 그룹 값을 결합하려면 그룹 크기를 곱하고 결과를 더한 다음 합계를 n으로 나눕니다 .
이 접근법을 적용하려면 미리 생각해야 합니다. 공분산과 부분 군 크기 만 알고있는 경우 공분산을 결합 할 수 없습니다 . 또한 부분 군의 평균도 알아야합니다 (수단이 필수적인 방식으로 관련되어 있기 때문에) 모든 공분산 공식에서) 또는 대수적으로 수단에 환원 가능한 것입니다. 또한 수식에 나타나는 상수와 관련하여주의를 기울여야 할 수도 있습니다. 조심성 최고 트랩 (나눈 제품의 합 관련된 "샘플 공분산"혼동하는 (분할에 의해 인 "모집단 공분산"로) N을 ). 이것은 새로운 것을 소개하지 않습니다. 당신은 단지에 의해 샘플 공분산을 곱 기억해야 N -n (또는 j i )이아니라 합을 복구하려면 1 (또는 j i - 1으로 그룹 공분산)하십시오.
아, 그렇습니다. 현재의 질문에 대해. Wikipedia 기사에 제공된 공식은 그룹 평균 (첫 번째 순간) 및 그룹 의 제품 합계 측면 에서 제공됩니다. 위에서 설명한 것처럼 이들을 더한 다음 나누기로 결과를 조정하여 공분산을 얻습니다. 에 의한 최종 나눗셈 은 표시되지 않습니다.