나는 다중 모달 분포를 모른다.
알려진 모든 분포가 단조로운 이유는 무엇입니까? 하나 이상의 모드를 가진 "유명한"배포판이 있습니까?
물론, 분포의 혼합은 종종 복합적인 것이지만, 하나 이상의 모드를 갖는 "비 혼합"분포가 있는지 알고 싶습니다.
나는 다중 모달 분포를 모른다.
알려진 모든 분포가 단조로운 이유는 무엇입니까? 하나 이상의 모드를 가진 "유명한"배포판이 있습니까?
물론, 분포의 혼합은 종종 복합적인 것이지만, 하나 이상의 모드를 갖는 "비 혼합"분포가 있는지 알고 싶습니다.
답변:
질문의 첫 번째 부분은 질문에 대한 의견으로 답변됩니다. 많은 "브랜드 이름"배포판은 멀티 모달 (예 : a < 1 및 b < 1 인 베타 배포판 ) 입니다. 그런 다음 질문의 두 번째 부분으로 넘어 갑시다.
모든 불연속 분포는 명확하게 혼합되어 있습니다 (원자, 단봉 형).
나는 대부분의 연속 분포가 단일 분포의 혼합임을 보여줄 것입니다. 이것의 직관은 간단합니다. 그래프가 수평이 될 때까지 PDF의 울퉁불퉁 한 그래프에서 하나씩 범프를 "모래 제거"할 수 있습니다. 범프는 혼합 구성 요소가되며 각 구성 요소는 분명히 단조롭습니다.
결과적으로, PDF가 매우 불연속적인 일부 비정상적인 분포를 제외하고는 이 질문에 대한 대답은 "없음"입니다. 절대적으로 연속적이거나 불연속 적이거나이 두 가지의 조합 인 모든 다중 모드 분포는 단봉 형 분포의 혼합입니다.
PDF가 f 인 연속 분포 를 고려하십시오 (이것은 "절대적으로 연속적인"분포입니다). 연속성은 그다지 제한적이지 않으며, 불연속 점이 불 연속적이라는 가정하에보다 신중한 분석으로 더욱 완화 될 수 있습니다.
발생할 수있는 상수 값의 "plateaus"에 대처하려면 "mode"를 간격 ( x l = x u 인 단일 지점 일 수 있음 )로 정의하십시오.
에 일정 값 보유 m을 , 말 Y를 .
는 m을 포함하는 모든 구간에서 일정하지 않습니다.
양수가 존재 등의 최대 값 것이 F 에 도달 [ X의 L - ε은 , X U + ε ]이 동일 (Y)를 .
하자 중 어느 모드 일 F . 때문에 F가 연속되고, 간격있다 [ X ' L , X ' 유 ] 함유 m 되는 F가 에 비 감소된다 [ X를 ' L , X L ] 과 nonincreasing (적절한 간격 아닌 점이다) [ X u , x ' u ](또한 적절한 간격입니다). 하자 모두 같은 값의 infinimum되고 X ' u는 이러한 모든 값 supremum.
이 구성은 x ′ l 에서 x ′ u 까지 의 그래프에서 하나의 "혹"을 정의했습니다 . 하자 Y는 의 클 F ( X ' (L) ) 와 F ( X ' U ) . 구성함으로써, 포인트들의 세트는 X 에 [ X ' L , X ' U ] 있는 F ( X ) ≥ y는 적절한 간격 m '엄격 함유 (그것의 전체 하나가 포함되어 있기 때문에 [ X ' L , X L ] 또는 [ X U를 , X를 ' U ] ).
이 멀티 모달 PDF 그림에서 모드 는 가로 축의 빨간색 점으로 식별됩니다. 채우기의 적색 부분의 수평 범위는 간격 m '입니다 . 이는 모드 m에 의해 결정된 혹의베이스입니다 . 그 고비의베이스 높이에있다 Y ≈ 0.16 . 원본 PDF는 빨간색 채우기와 파란색 채우기의 합입니다. 파란색 채우기는 2 근처에 하나의 모드 만 있습니다 . [ 0 , 0 ] 의 원래 모드 가 제거되었습니다.
쓰기 m ' 의 길이에 대해 정의
과
때 및 , 그렇지. (이것은 을 연속 함수로 만듭니다 .) 분자는 위로 올라가는 양 이고 분모 은 와 의 그래프 사이의 영역 입니다. 따라서 은 음이 총 면적 갖습니다 . 이것은 확률 분포의 PDF입니다. 구성에 따라 고유 모드 있습니다.f m ( x ) = 0 f m f y p m f y f m 1 m
또한 시공에 의해 기능
제공되는 PDF 입니다. ( 경우 왼쪽에 아무것도없는 것이 없으며 시작하기 위해 이어야합니다.) 또한, 간격 (일정한 곳) 에는 모드가 없습니다. 간격으로서의 모드가 필요했다). 더욱이,p m = 1m '
unimodal PDF 과 PDF 의 혼합 입니다 .f ' m
(연속 함수의 선형 조합은 여전히 연속 함수이므로 이전과 같이 진행할 수 있음) 으로이 절차를 반복 하여 일련의 모드를 생성합니다. ; 대응하는 가중치 시퀀스 ; 및 PDF (a) 가 평탄화되는 구간에 앞 에서 평탄화되지 않은 적절한 구간이 포함되어 있기 때문에 제한 결과가 존재합니다. m = m 1 , m 2 , ... , P (1) = P m , P (2) = P m 2 , ... F (1) = F m , F (2) = F m 2 , ... . f i i - 1 f연산 및 (b) 실수는 계산 가능한 개수 이상의 그러한 간격으로 분해 될 수 없다. 제한은 모드를 가질 수 없으므로 일정하므로 0이어야합니다 (그렇지 않으면 적분이 분기 될 수 있음). 결과적으로 는 혼합으로 표현되었습니다 (아마도 모드를 선택한 순서가 중요하기 때문에 고유하지는 않습니다).
단봉 분포, QED.
unimodal에 따르면 OP는 분명히 하나의 내부 모드 (즉, 코너 솔루션 제외)가 있음을 의미한다고 생각합니다. 따라서 질문은 실제로 묻습니다.
즉, 대부분의 브랜드 배포가 다음과 같은 이유는 무엇입니까?
... 왜도 또는 불연속을 플러스 또는 마이너스? 따라서 질문이 제기 될 때 베타 배포는 올바른 반례가되지 않습니다.
OP의 추측에는 어느 정도의 유효성이있는 것으로 보입니다. 가장 일반적인 브랜드 배포는 둘 이상의 내부 모드를 허용하지 않습니다. 이에 대한 이론적 인 이유가있을 수 있습니다. 예를 들어, Pearson 계열 (Beta 포함)의 구성원 인 분포는 전체 계열을 정의하는 모 차등 식의 결과로 반드시 (내부) 단봉이됩니다. Pearson 제품군은 가장 잘 알려진 브랜드 이름을 중첩합니다.
그럼에도 불구하고 다음은 브랜드 카운터 예입니다.
카운터 예
브랜드 이름의 반대 예는 pdf 가 포함 된 배포판입니다.
실제 라인에 정의되어 있습니다. 다음은 pdf 의 도표입니다 .
또한 다음과 같은 pdf 플롯을 사용하여이 클래스와 관련된 카디오이드 및 배포 제품군을 추가 할 수도 있습니다.
반영된 브랜드 배포는 다음과 같이 Reflected Weibull과 같은 브랜드 이름 경쟁자 일 수도 있습니다.
당신이 전혀 생각하지 않는다고해서 아무것도 없다는 것을 의미하지는 않습니다.
단조롭지 않은 "알려진"배포판의 이름을 지정할 수 있습니다.
http://en.wikipedia.org/wiki/Beta_distribution
또한보십시오
http://en.wikipedia.org/wiki/U-quadratic_distribution
(이것은 의견이 있음에도 불구하고 베타 배포판의 특별한 경우는 아닙니다. 그러나 두 가족은 약간 중복됩니다.)
혼합물 분포는 확실히 알려져 있으며, 이들 중 다수는 다중 모드이다.