알려진 모든 분포가 단조로운 이유는 무엇입니까?


13

나는 다중 모달 분포를 모른다.

알려진 모든 분포가 단조로운 이유는 무엇입니까? 하나 이상의 모드를 가진 "유명한"배포판이 있습니까?

물론, 분포의 혼합은 종종 복합적인 것이지만, 하나 이상의 모드를 갖는 "비 혼합"분포가 있는지 알고 싶습니다.


5
당신은 "알려진"배포판보다는 "표준"배포판에 대해 이야기하고 있습니다
Stéphane Laurent

12
방법에 대한 베타α=β=0.5 ?
amoeba는 11시 32 분에 Reinstate Monica

1
한정된 바이 모달 분포를 신경 쓰지 않는다면 Wikipedia는 U-quadraticarcsine 분포를 언급합니다 . 나는 이것들이 베타 배포판의 특별한 경우라고 생각합니다 ... Wikipedia는 또한 다중 모달 분포의 자연 발생에 대한 몇 가지 예를 언급합니다 .
Nick Stauner

12
@ StéphaneLaurent : 나는 "브랜드 이름 배포"를 좋아하는데 , 그 이름이 지어진 것은 그 자체로 배포에 대한 특별한 지위를 암시하지 않는다는 것을 전달합니다. "알려진"분포는 Loch-Ness 괴물이나 암흑 물질과 같이 나머지 곳이 발견되기를 기다리는 곳처럼 들립니다.
Scortchi-Monica Monica 복원

5
훌륭한 @Scortchi, 훌륭한 어휘! 내가 만난 많은 비 수학자 과학자들은 이름이없는 분포가 존재하지 않는다는 인상을 받고 있습니다. 아마도 그 뒤에는 더 깊은 철학적 사실이있을 것입니다. 이름과이 이름으로 표시된 것의 혼동 (러셀은 " '개'라는 단어는 개와 닮지 않습니다")
Stéphane Laurent

답변:


17

질문의 첫 번째 부분은 질문에 대한 의견으로 답변됩니다. 많은 "브랜드 이름"배포판은 멀티 모달 (예 : a < 1b < 1 인 베타 배포판 ) 입니다. 그런 다음 질문의 두 번째 부분으로 넘어 갑시다.(a,b)a<1b<1

모든 불연속 분포는 명확하게 혼합되어 있습니다 (원자, 단봉 형).

나는 대부분의 연속 분포가 단일 분포의 혼합임을 보여줄 것입니다. 이것의 직관은 간단합니다. 그래프가 수평이 될 때까지 PDF의 울퉁불퉁 한 그래프에서 하나씩 범프를 "모래 제거"할 수 있습니다. 범프는 혼합 구성 요소가되며 각 구성 요소는 분명히 단조롭습니다.

결과적으로, PDF가 매우 불연속적인 일부 비정상적인 분포를 제외하고는 이 질문에 대한 대답은 "없음"입니다. 절대적으로 연속적이거나 불연속 적이거나이 두 가지의 조합 인 모든 다중 모드 분포는 단봉 형 분포의 혼합입니다.


PDF가 f 인 연속 분포 를 고려하십시오 (이것은 "절대적으로 연속적인"분포입니다). 연속성은 그다지 제한적이지 않으며, 불연속 점이 불 연속적이라는 가정하에보다 신중한 분석으로 더욱 완화 될 수 있습니다. Ff

발생할 수있는 상수 값의 "plateaus"에 대처하려면 "mode"를 간격 ( x l = x u 인 단일 지점 일 수 있음 )로 정의하십시오.m=[xl,xu]xl=xu

  1. 에 일정 값 보유 m을 , Y를 .fm,y

  2. m을 포함하는 모든 구간에서 일정하지 않습니다.fm

  3. 양수가 존재 등의 최대 값 것이 F 에 도달 [ X의 L - ε은 , X U + ε ]이 동일 (Y)를 .ϵf[xlϵ,xu+ϵ]y

하자 중 어느 모드 일 F . 때문에 F가 연속되고, 간격있다 [ X ' L , X ' ] 함유 m 되는 F가 에 비 감소된다 [ X를 ' L , X L ] 과 nonincreasing (적절한 간격 아닌 점이다) [ X u , x ' u ]m=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu](또한 적절한 간격입니다). 하자 모두 같은 값의 infinimum되고 X ' u는 이러한 모든 값 supremum.xlxu

이 구성은 x l 에서 x u 까지 의 그래프에서 하나의 "혹"을 정의했습니다 . 하자 Y는 의 클 F ( X ' (L) )F ( X ' U ) . 구성함으로써, 포인트들의 세트는 X[ X ' L , X ' U ] 있는 F ( X ) y는 적절한 간격 m 'fxlxuyf(xl)f(xu)x[xl,xu]f(x)ym엄격 함유 (그것의 전체 하나가 포함되어 있기 때문에 [ X ' L , X L ] 또는 [ X U를 , X를 ' U ] ).m[xl,xl][xu,xu]

그림

이 멀티 모달 PDF 그림에서 모드 는 가로 축의 빨간색 점으로 식별됩니다. 채우기의 적색 부분의 수평 범위는 간격 m '입니다 . 이는 모드 m에 의해 결정된 혹의베이스입니다 . 그 고비의베이스 높이에있다 Y 0.16 . 원본 PDF는 빨간색 채우기와 파란색 채우기의 합입니다. 파란색 채우기는 2 근처에 하나의 모드 만 있습니다 . [ 0 , 0 ] 의 원래 모드 가 제거되었습니다.m=[0,0]mmy0.162[0,0]

쓰기 m ' 의 길이에 대해 정의|m|m

pm=PrF(m)y|m|

fm(x)=f(x)ypm

때 및 , 그렇지. (이것은 을 연속 함수로 만듭니다 .) 분자는 위로 올라가는 양 이고 분모 은 와 의 그래프 사이의 영역 입니다. 따라서 은 음이 총 면적 갖습니다 . 이것은 확률 분포의 PDF입니다. 구성에 따라 고유 모드 있습니다.f m ( x ) = 0 f m f y p m f y f m 1 mxmfm(x)=0fmfypmfyfm1m

또한 시공에 의해 기능

fm(x)=f(x)pmfm(x)1pm

제공되는 PDF 입니다. ( 경우 왼쪽에 아무것도없는 것이 없으며 시작하기 위해 이어야합니다.) 또한, 간격 (일정한 곳) 에는 모드가 없습니다. 간격으로서의 모드가 필요했다). 더욱이,p m = 1pm<1pm=1m 'f,m

f(x)=pmfm(x)+(1pm)fm(x)

unimodal PDF 과 PDF 의 혼합 입니다 .f ' mfmfm

(연속 함수의 선형 조합은 여전히 ​​연속 함수이므로 이전과 같이 진행할 수 있음) 으로이 절차를 반복 하여 일련의 모드를 생성합니다. ; 대응하는 가중치 시퀀스 ; 및 PDF (a) 가 평탄화되는 구간에 앞 에서 평탄화되지 않은 적절한 구간이 포함되어 있기 때문에 제한 결과가 존재합니다. m = m 1 , m 2 , ... , P (1) = P m , P (2) = P m 2 , ... F (1) = F m , F (2) = F m 2 , ... . f i i - 1 ffmm=m1,m2,p1=pm,p2=pm2,f1=fm,f2=fm2,.fii1연산 및 (b) 실수는 계산 가능한 개수 이상의 그러한 간격으로 분해 될 수 없다. 제한은 모드를 가질 수 없으므로 일정하므로 0이어야합니다 (그렇지 않으면 적분이 분기 될 수 있음). 결과적으로 는 혼합으로 표현되었습니다 (아마도 모드를 선택한 순서가 중요하기 때문에 고유하지는 않습니다).f

f(x)=ipifi(x)

단봉 분포, QED.


7

unimodal에 따르면 OP는 분명히 하나의 내부 모드 (즉, 코너 솔루션 제외)가 있음을 의미한다고 생각합니다. 따라서 질문은 실제로 묻습니다.

why is it that brand name distributions do NOT have more than one interior mode?

즉, 대부분의 브랜드 배포가 다음과 같은 이유는 무엇입니까?

여기에 이미지 설명을 입력하십시오

... 왜도 또는 불연속을 플러스 또는 마이너스? 따라서 질문이 제기 될 때 베타 배포는 올바른 반례가되지 않습니다.

OP의 추측에는 어느 정도의 유효성이있는 것으로 보입니다. 가장 일반적인 브랜드 배포는 둘 이상의 내부 모드를 허용하지 않습니다. 이에 대한 이론적 인 이유가있을 수 있습니다. 예를 들어, Pearson 계열 (Beta 포함)의 구성원 인 분포는 전체 계열을 정의하는 모 차등 식의 결과로 반드시 (내부) 단봉이됩니다. Pearson 제품군은 가장 잘 알려진 브랜드 이름을 중첩합니다.

그럼에도 불구하고 다음은 브랜드 카운터 예입니다.

카운터 예

브랜드 이름의 반대 예는 pdf 가 포함 된 배포판입니다.Sinc2

f(x)=sin2(x)πx2

실제 라인에 정의되어 있습니다. 다음은 pdf 의 도표입니다 .Sinc2

여기에 이미지 설명을 입력하십시오

또한 다음과 같은 pdf 플롯을 사용하여이 클래스와 관련된 카디오이드 및 배포 제품군을 추가 할 수도 있습니다.

여기에 이미지 설명을 입력하십시오

반영된 브랜드 배포는 다음과 같이 Reflected Weibull과 같은 브랜드 이름 경쟁자 일 수도 있습니다.

여기에 이미지 설명을 입력하십시오


1
내 줄거리에 음수 값이있는 것 같습니다! (그것이 플로팅 아티팩트 일 수 있습니까?) ... 그리고 카디오이드 분포는 각각 하나의 내부 모드 만있는 것처럼 보입니다. Sinc2
whuber

1
안녕 @ whuber ... 음모를 꾸미는 인공물에 동의해야합니다 ( Mathematica SE 에서 가져갑니다 !). Cardiod 가족 : 아이디어는 하나의 같은 가족의 영역을 확장 할 수 있으며 사인파처럼 계속 제공합니다 :)
wolfies

1
Sinc2

플롯 된 선이 축 선보다 두껍기 때문에 0에 가까울 때 축을 '오버 슈트'하는 것처럼 보입니다. 선이 더 얇게 플롯되면 인공물이 사라집니다.
wolfies

그러나 아래쪽 그림에는 축보다 두꺼운 선이있는 아티팩트가 없습니다.
whuber

3

당신이 전혀 생각하지 않는다고해서 아무것도 없다는 것을 의미하지는 않습니다.

단조롭지 않은 "알려진"배포판의 이름을 지정할 수 있습니다.

αβ<1

http://en.wikipedia.org/wiki/Beta_distribution

또한보십시오

http://en.wikipedia.org/wiki/U-quadratic_distribution

(이것은 의견이 있음에도 불구하고 베타 배포판의 특별한 경우는 아닙니다. 그러나 두 가족은 약간 중복됩니다.)

혼합물 분포는 확실히 알려져 있으며, 이들 중 다수는 다중 모드이다.


U-quadratic은 잘린 베타 분포입니다.
becko

1

알파-스큐 정규 분포 (Elal-Olivero 2010) 에는 PDF가 있습니다.

(1αxμσ)2+12+α2φ(xμσ),

φ

|α|>1.34μ=1,σ=0.5,a=2

여기에 이미지 설명을 입력하십시오

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.