다항 분포의 정규 근사값은 얼마입니까?


답변:


21

이항 분포가 일 변량 정규 분포에 의해 근사되는 것과 같은 방식으로 다변량 정규 분포로 근사 할 수 있습니다. 분포 이론다항 분포의 요소 확인 페이지 15-16-17.

하자 당신의 확률의 벡터합니다. 다변량 정규 분포의 평균 벡터는 입니다. 공분산 행렬은 대칭 행렬입니다. 대각선 요소는 실제로 의 분산입니다 . 즉 , 입니다. i 번째 행과 j 번째 열의 비 대각선 요소는 . 여기서 는 .P=(p1,...,pk)np=(np1,np2,...,npk)k×kXinpi(1pi)i=1,2...,kCov(Xi,Xj)=npipjij


1
두 번째 참조를 확인하십시오.
통계

3
Stat,이 답변이 저절로 견딜 수 있도록하고 (부패 방지) 솔루션에 대한 요약을 해 주시겠습니까?
whuber

4
연속성 수정이 필요합니까? 어떻게 적용 하시겠습니까?
Jack Aidley

2
공분산 행렬은 양의 한정이 아니라 양의 반정의이며 풀 랭크가 아닙니다. 결과 다중 정규 분포가 정의되지 않습니다. 이것이 내가 직면 한 문제입니다. 그것을 처리하는 방법에 대한 아이디어가 있습니까?
Mohammad Alaggan

2
@ M.Alaggan : 여기에 정의 된 평균 / 공분산 행렬에는 한 가지 사소한 문제가 있습니다. 변수가 있는 다항 분포의 경우 등가 다변량 법선에는 변수가 있습니다. 이것은 간단한 이항 예제에서 분명하며, 이는 정규 분포에 의해 근사됩니다. 추가 논의 는 분포 이론 요소의 예 12.7을 참조하십시오 . kk1
MS Dousti

1

이 답변에 주어진 밀도 는 퇴화되므로, 다음을 사용하여 정규 근사에서 얻은 밀도를 계산했습니다.

확률 변수 소정라는 이론있어 들면 차원 벡터 와 및 입니다.X=[X1,,Xm]TMultinom(n,p)mpipi=1iXi=n

Xdndiag(u)Q[Z1Zm10]+[np1npm],

큰 에 대해 주어진;n

  • 벡터 와 ;uui=pi
  • 대한 랜덤 변수 및;ZiN(0,1)i=1,,m1
  • 직교 행렬 마지막 컬럼 .Qu

다시 말해, 일부 재 배열 을 통해 의 첫 번째 성분 ( 이 다른 성분 의 합 이므로 유일하게 흥미로운 성분 )에 대한 차원 다변량 정규 분포를 있습니다.m1m1XXm

매트릭스의 적절한 값 이고 와 - 즉 특정 세대주 변환.QI2vvTvi=(δimui)/2(1um)

왼쪽을 첫 번째 행으로 제한하고 를 첫 번째 행 및 열로 제한하면 (각각 및 나타냄) 다음을 수행하십시오.m1Qm1m1X^Q^

X^dndiag(u^)Q^[Z1Zm1]+[np1npm1]N(μ,nΣ),

큰 의 경우;n

  • u^ 제 나타내고 의 조건 ;m1u
  • 평균은 .μ=[np1,,npm1]T
  • 공분산 행렬 와 .nΣ=nAATA=diag(u^)Q^

최종 방정식의 오른쪽은 계산에 사용되는 비축 퇴 밀도입니다.

예상대로 모든 것을 연결하면 다음과 같은 공분산 행렬이 나타납니다.

(nΣ)ij=npipj(δijpipj)

위한 이고, 정확하게 는 제 한정 일본어 대답 공분산 행렬 행과 컬럼.i,j=1,,m1m - 1 m - 1m1m1

블로그 항목 은 저의 출발점이었습니다.



1
좋은 대답 (+1) --- 구문으로 링크를 포함 할 수 있습니다 [textual description](hyperlink). 귀하의 링크를 포함시키기 위해이 답변을 자유롭게 편집 할 수 있습니다.
벤-복원 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.