디리클레 분포를 설명하는 변수의 확률 분포 변수 X 1k≥2 , 예컨대 각각이 X I ∈ ( 0 , 1 ) 및 Σ N 난 = 1 X 난 = 1 , 벡터에 의해 매개 변수화된다 양수 값의 매개 변수 α = ( α 1 , … , α k ) . 매개 변수는하지 않습니다X1,…,Xkxi∈(0,1)∑Ni=1xi=1α=(α1,…,αk)정수 여야하며 양의 실수 여야합니다. 그것들은 어떤 식 으로든 "정규화 된"것이 아니며,이 분포의 매개 변수입니다.
Dirichlet 배포는 베타 배포 를 여러 차원으로 일반화 한 것이므로 베타 배포에 대해 배우는 것부터 시작할 수 있습니다. 베타는 랜덤 변수의 변량 분포 파라미터에 의해 파라미터 α 및 β . 당신이이 것을 기억 경우의 좋은 직감이 온다 복합체 이전 에 대한 이항 분포 우리는 이전에 의해 파라미터 베타 가정하면 α 와 β 이항 분포의 확률 변수에 대한 페이지 의 다음 사후 분포 P는X∈(0,1)αβαβpp또한 및 β ' = β + 실패 횟수로 매개 변수가 지정된 베타 분포 입니다. 따라서 성공 및 실패 의 의사 수 (정수일 필요는 없음) 로 α 및 β 를 생각할 수 있습니다 (확인α′=α+number of successesβ′=β+number of failuresαβ 이 스레드 ).
Dirichlet 분포의 경우 다항 분포에 대한 공액 입니다. 이항 분포의 경우 우리는 항아리에서 대체로 흰색과 검은 색 볼을 그리는 관점에서 그것을 생각할 수 있다면, 다항식 분포의 경우 우리는 대체 N 볼을 k 색상으로 나타나는 대체 색 볼로 그립니다. 공의 확률은 확률 p 1 , … , p k 로 그릴 수 있습니다 . Dirichlet 분포는 p 1 , … , p k 확률 및 α 1 이전의 켤레입니다.Nkp1,…,pkp1,…,pk는 베타 이항 모델의 경우와 유사한 방식으로와 같이. 모수는각 색상의 볼의의사 카운트가선험적으로가정 된 것으로 간주될 수 있습니다(그러나그러한 추론의함정에대해서도 읽어야합니다). Dirichlet- 다항식 모델 α 1 , … , α k 는 각 카테고리의 관측 카운트로 그것들을 합산하여 업데이트됩니다 : α 1 + n 1 , … , α k + n kα1,…,αkα1,…,αkα1+n1,…,αk+nk
더 높은 가치 X i 의 "무게"가커지고 총 "질량"의 양이 더 많이 할당됩니다 (총 x 1 + ⋯ + x k = 1 이어야 함). 모든 α i 가 동일하면 분포가 대칭입니다. 경우 α I < 1 ,이를 방지 중량으로 간주 될 수있는 푸쉬 떨어져 있음 X 난을 가 높을 때, 끌어하면서, 극단 방향 X 나을 모든 점 주위에 집중되어 있다는 점에서 중앙 일부 중앙값 향해을 (되지αiXix1+⋯+xk=1αiαi<1xixi대칭 중심이라는 의미에서). 만약 , 다음 포인트가 균일하게 분포되어있다.α1=⋯=αk=1
아래 그림에서 볼 수 있습니다. 여기서 3 변량 Dirichlet 분포를 볼 수 있습니다 (불행히도 최대 3 차원까지 합리적인 그림을 생성 할 수 있음). (a) α1=α2=α3=1 , (b) , (c) α 1 = 1 , α 2 = 10 , α 3 = 5 , (d) α 1 = α 2 = α =α1=α2=α3=10α1=1,α2=10,α3=5 .α1=α2=α3=0.2
Dirichlet 분포는 확률 분포 자체로 생각할 수 있기 때문에 때때로 "분포에 대한 분포" 라고도 합니다. 각 및 ∑ k i = 1 x i = 1 이므로 x i 는 확률 의 첫 번째 및 두 번째 공리 와 일치합니다 . 따라서 Dirichlet 분포를 categorical 또는 multinomial 과 같은 분포로 설명 된 불연속 사건에 대한 확률 분포로 사용할 수 있습니다 . 그것은xi∈(0,1)∑ki=1xi=1xi 것은예를 들어 연속 랜덤 변수의 확률 또는 일부 불연속 변수와 관련이없는 분포와 같은 분포에 대한 분포라는 사실입니다 (예 : 포아송 분산 랜덤 변수는 자연수 값을 관찰하는 확률을 설명하므로 확률에 대한 디 리클 렛 분포에는 무한한 수의 랜덤 변수 ) 가 필요합니다 .k