두 표준이 공통 표준 편차의 두 배 이상 차이가 나면 정규 분포 변수 두 개가 왜 이봉만 혼합됩니까?


28

두 정규 분포의 혼합에서 :

https://ko.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions

"정규 분포가 두 개인 혼합은 추정 할 매개 변수가 다섯 개입니다. 두 가지 평균, 두 가지 분산 및 혼합 모수. 동일한 표준 편차를 갖는 두 개의 정규 분포의 혼합은 평균 표준 편차의 두 배 이상 차이가 나는 경우에만 양봉입니다. "

왜 이것이 사실인지에 대한 파생 또는 직관적 인 설명을 찾고 있습니다. 나는 그것이 두 개의 샘플 t 테스트 형태로 설명 될 수 있다고 생각합니다.

μ1μ2σp

여기서 는 풀링 된 표준 편차입니다.σp


1
직감은, 평균이 너무 가까우면 두 밀도의 질량이 너무 많이 겹치게되어 차이가 두 질량에 가까워지기 때문에 평균의 차이가 보이지 않는다는 것입니다. 밀도. 두 평균이 충분히 다르면 두 밀도의 질량이 그와 겹치지 않으며 평균의 차이를 식별 할 수 있습니다. 그러나 이것에 대한 수학적 증거를보고 싶습니다. 말도 안되는 진술입니다. 나는 그것을 전에 본 적이 없다.
mlofton

2
더 공식적으로, 동일한 SD 가진 두 정규 분포의 50:50 혼합의 경우 밀도 를 전체 형태로 작성하면 모수를 표시 할 수 있습니다. 평균 사이의 거리가 아래 에서 위 까지 증가 할 때 두 번째 미분이 두 평균 사이의 중간 점에서 부호가 바뀌는 것을 볼 수 있습니다. f ( x ) = 0.5 g 1 ( x ) + 0.5 g 2 ( x ) 2 σσ,f(x)=0.5g1(x)+0.5g2(x)2σ
BruceET

답변:


53

해당 위키 기사에 링크 된 논문의이 그림은 다음과 같은 멋진 그림을 제공합니다. 여기에 이미지 설명을 입력하십시오

그들이 제공하는 증거는 정규 분포가 평균의 하나의 SD 내에서 오목하다는 사실에 근거합니다 (SD는 일반 PDF의 변곡점이며 오목에서 볼록으로 변합니다). 따라서 두 개의 일반 pdf를 함께 (동일한 비율로) 추가하면 평균이 두 개의 SD보다 작은 경우 합 -pdf (즉, 혼합물)는 두 평균 사이의 영역에서 오목하게됩니다. 전체 최대 값은 두 평균 간의 정확한 지점에 있어야합니다.

참고 자료 : Schilling, MF, Watkins, AE, & Watkins, W. (2002). 인간 높이 바이 모달입니까? 미국 통계 학자, 56 (3), 223–229. 도 : 10.1198 / 00031300265


11
+1 이것은 기억에 남는 좋은 주장입니다.
whuber

2
그림 캡션은 '변형'에서 잘못 제시된 'fl'합자에 대한 멋진 그림을 제공합니다. -P
nekomatic

2
@ Axeman : 그 참조를 추가 해 주셔서 감사합니다. 이것이 조금 터 졌기 때문에 직접 추가하려고 계획하고 있었기 때문에 실제로 그들의 주장을 반복하고 있기 때문에 너무 많은 신용을 얻고 싶지 않습니다.
Ruben van Bergen

14

이것은 그림이 속일 수있는 경우입니다. 이 결과는 일반 혼합물 의 특수한 특성이기 때문입니다 . 구성 요소가 대칭 단봉 분포 일지라도 아날로그가 다른 혼합물을 반드시 유지할 필요는 없습니다! 예를 들어, 공통 표준 편차의 두 배 미만으로 분리 된 두 개의 Student t 분포가 동일하게 혼합되면 양봉이됩니다. 실제 통찰력을 얻으려면 정규 분포의 특수 속성에 수학을하거나 호소해야합니다.


구성 요소 분포의 평균을 ±μ, μ0, 하고 공통 분산을 만들려면 측정 단위 (필요에 따라 최근 조정 및 재조정)를 선택하십시오 . 하자 p, 0<p<1, 혼합물에서 더 큰 평균 성분의 금액. 이를 통해 혼합물 밀도를 전체 일반 도로

2πf(x;μ,p)=pexp((xμ)22)+(1p)exp((x+μ)22).

여기서, 두 성분의 밀도가 증가하기 때문에 x<μ 및 감소 여기서 x>μ, 가능한 유일한 모드 여기서 발생 μxμ.x 와 관련하여 f 를 구별 하고 0으로 설정 하여 찾으십시오 . 우리가 얻는 양의 계수 지우기x

0=e2xμp(xμ)+(1p)(x+μ).

f 의 2 차 도함수로 유사한 연산을 수행 하고 e2xμ 를 위의 방정식으로 결정된 값으로 대체 하면 임계점에서 2 차 도함수의 부호는

f(x;μ,p)(1+x2μ2)xμ.

μ<x<μ, 때 분모가 음수이므로 f 의 부호 는 (1μ2+x2). 의 부호입니다 . 이 때 분명하다 μ1, 부호는 음수가 될 수 있어야합니다. 그러나 멀티 모달 분포에서는 밀도가 연속적이기 때문에 부호가 음이 아닌 두 모드 사이 에 안티 모드 가 있어야합니다 . 따라서 μ1 보다 작은 경우 (SD) 분포는 단봉이 아니 어야합니다.

수단의 분리 때문에 2μ, 이 분석의 결론은

평균이 공통 표준 편차의 두 배 이하로 분리 될 때마다 정규 분포의 혼합은 단조롭습니다.

그것은 문제의 진술과 논리적으로 동일합니다.


12

연속성을 위해 여기에 붙여 넣은 주석 :

"[F] 일반적으로 동일한 SD σ를 갖는 두 개의 정규 분포가 50:50 인 혼합의 경우 밀도

f(x)=0.5g1(x)+0.5g2(x)
를 전체 형태로 쓰면 변수 사이에서 평균 간의 거리가 2σ 아래에서 위로 증가 할 때 두 번째 미분 값이 두 평균 사이의 중간 점에서 부호가 있음을 알 수 있습니다. "

댓글 계속 :

각각의 경우에 '혼합 된'인 두 정상 곡선이 σ=1. 수단은 사이의 거리를 왼쪽에서 오른쪽으로 3σ,2σ,σ, 각각이. 중간 점 (1.5)에서의 혼합물 밀도의 오목 함은 평균에서 0으로, 양으로 변경된다.

enter image description here

그림의 R 코드 :

par(mfrow=c(1,3))
  curve(dnorm(x, 0, 1)+dnorm(x,3,1), -3, 7, col="green3", 
    lwd=2,n=1001, ylab="PDF", main="3 SD: Dip")
  curve(dnorm(x, .5, 1)+dnorm(x,2.5,1), -4, 7, col="orange", 
    lwd=2, n=1001,ylab="PDF", main="2 SD: Flat")
  curve(dnorm(x, 1, 1)+dnorm(x,2,1), -4, 7, col="violet", 
    lwd=2, n=1001, ylab="PDF", main="1 SD: Peak")
par(mfrow=c(1,3))

1
모든 답변이 훌륭했습니다. 감사.
mlofton

3
2/30.001.

1
0.1% fx0)
f(x0)f(x)0.001f(x0)  |xx0|0.333433,
0.0010.95832
f(x0)f(x)0.001  |xx0|0.47916.

좋은 지적입니다. 사실, 약자 'flat'이 의미하는 바는 정확히 중간 지점에서 2 차 미분이었습니다.
BruceET
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.