두 가우스의 가중 혼합의 차이는 무엇입니까?


38

평균 μ B 와 분산 σ Aσ B를 갖는 두 개의 정규 분포 A와 B가 있다고 가정 합니다. 가중치 pq를 사용하여이 두 분포의 가중치 혼합을 취하려고합니다. 여기서 0 p 1q = 1 - p 입니다. 이 혼합물의 평균은 μ A B = ( p × μ A ) + ( q × μ B ) 임을 알고 있습니다μAμBσAσBpq0p1q=1pμAB=(p×μA)+(q×μB).

차이는 무엇입니까?


구체적인 예는 남성과 여성의 높이 분포에 대한 모수를 알고 있다면입니다. 60 % 남성 인 사람의 방이 있다면 방 전체의 예상 평균 높이를 산출 할 수 있지만 차이는 어떻습니까?


용어 : 혼합물은 단순히 평균과 분산을 가진다; q 가 임의의 변수로 간주되어야한다고 암시하지 않는 한, 이들을 "예상"으로 규정하는 것은 의미가 없습니다 . pq
whuber

두 개의 가우시안 분포가 혼합되어 있음을 알고 있습니다. 그러나 두 배포판에 동일한 맨이 있다면? 즉, 동일한 평균과 다른 표준 편차를 가진 두 정규 분포의 혼합을 식별 할 수 있습니까? 이와 관련하여 논문이 있습니까? 미리 감사드립니다

1
여기에 답변과 비슷한 질문이 있습니다 (COVARIANCES도 처리). math.stackexchange.com/q/195911/96547
hplieninger

답변:


62

분산은 두 번째 모멘트에서 첫 번째 모멘트의 제곱을 뺀 값이므로 혼합 모멘트를 계산하기에 충분합니다.

일반적으로, PDF 파일과 소정의 분포 상수 (비 - 랜덤) 무게 (P) , 혼합물의 PDF는fipi

f(x)=ipifi(x),

이로부터 어떤 순간 즉시 다음 해당k

μ(k)=Ef[xk]=ipiEfi[xk]=ipiμi(k).

I는 작성한 대한 K의 t의 시간 의 순간 Fμ ( K ) I 대한 전율 t의 시간 의 순간 F .μ(k)kthfμi(k)kthfi

이 공식을 사용하여 분산을 쓸 수 있습니다

Var(f)=μ(2)(μ(1))2=ipiμi(2)(ipiμi(1))2.

동등하게, 의 분산이 σ 2 i 로 주어지면 , μ ( 2 ) i = σ 2 i + ( μ ( 1 ) i ) 2 , 혼합물 f 의 분산 이 구성 요소의 분산 및 수단fiσi2μi(2)=σi2+(μi(1))2f

Var(f)=ipi(σi2+(μi(1))2)(ipiμi(1))2=ipiσi2+ipi(μi(1))2(ipiμi(1))2.

즉, 이것은 (가중) 평균 분산에 평균 제곱 평균에서 평균 평균 제곱을 뺀 값입니다. 제곱은 볼록 함수이므로 Jensen의 부등식은 평균 제곱 평균이 평균 평균의 제곱 이상일 수 있다고 주장합니다. 이것은 우리에게 알리는 등 화학식 이해할 수 혼합물의 분산을이 편차를 혼합물이 플러스 수단의 (가중) 분산액 차지하는 음이 아닌 용어.

귀하의 경우 차이는

pAσA2+pBσB2+[pAμA2+pBμB2(pAμA+pBμB)2].

pAσA2+pBσB2

질문에 주어진 것과 같이 데이터를 해석하는 데이 차이가 유용하다는 것은 혼합물 분포가 정상적이지 않기 때문에 (이 분성이 나타나는 정도까지 실질적으로 이탈 할 수 있기 때문에) 의심 스럽다.


8
pA+pB=1σ2=μ(2)μ2=pAσA2+pBσB2+pApB(μAμB)2

2
ApAXAN(μA,σA2)XAc=BN(μB,σB2)(X)YμA,μBpqE[Y2](E[Y])2

1
@Neodyme 정의에 따르면 분산은 두 번째 모멘트에서 평균 제곱을 뺀 것입니다. 따라서 두 번째 순간은 분산 평균 제곱을 더한 것입니다.
whuber

1
E(X)=μ

1
@Kiran 경우에 따라 혼합물이 정상으로 보일 수 있지만 그렇지 않습니다. 그것을 보는 한 가지 방법은 여기에 주어진 공식을 사용하여 과잉 첨도를 계산하는 것입니다. 모든 표준 편차가 동일하지 않으면 0이 아닙니다.이 경우 "혼합물"은 실제로 혼합물이 아닙니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.