Dirichlet 분포에서 심플 렉스를 삼각형 표면으로 나타내는 의미는 무엇입니까?


9

Dirchilet 배포판을 소개하고 그에 관한 수치를 제시 한 책을 읽고 있습니다. 그러나 나는 그 수치를 실제로 이해할 수 없었습니다. 아래 그림을 여기에 첨부했습니다. 내가 이해하지 못하는 것은 삼각형의 의미입니다.

일반적으로 두 변수의 함수를 플로팅하려는 경우 var1 및 va2의 값을 가져 와서 두 변수의 함수 값을 플로팅합니다. 이는 3D 차원으로 시각화됩니다. 그러나 여기에는 3 차원과 함수 값에 대한 다른 값이 있으므로 4D 공간에서 시각화합니다. 나는 그 수치를 이해할 수 없다!

누군가가 그들을 명확히 할 수 있기를 바랍니다!

편집하다: 그림 2.14a에서 이해하지 못하는 것이 있습니다. 그래서 우리는 샘플 세타 (기본적으로 벡터) 인 K = 3 디 리치 렛으로부터 다음과 같은 것을 얻었습니다 : theta = [theta1, theta2, theta3]. 삼각형은 [theta1, theta2, theta3]을 나타냅니다. 원점에서 각 theta_i까지의 거리는 theta_i의 값입니다. 그런 다음 각 theta_i마다 정점을 놓고 세 정점을 모두 연결하고 삼각형을 만들었습니다. [theta1, theta2, theta3]을 dir (theta | a)에 꽂으면 벡터 세타의 결합 확률 인 하나의 숫자를 얻게됩니다. 또한 연속 랜덤 변수의 확률은 면적의 척도라는 것을 이해합니다. 그러나 여기서 우리는 3 차원을 가지므로 관절 확률은 분홍색 평면에서 그리고 피라미드 아래에서 공간의 부피를 측정 할 것입니다. 이제 삼각형의 역할이 무엇인지 이해하지 못합니다.

여기에 이미지 설명을 입력하십시오


2
베타 배포에서 시작하여 거기서부터 작업하는 것이 좋습니다. 3에 대한 디리클레는 2의 디리클레입니다 베타의 "그냥"논리적 확장입니다
안드리 Birkmanis

예를 보려면
Tim

베타 분포가 2D ({0,1} 이진 결과를 나타내는 x 축과 확률을 나타내는 y 축)로 표시되므로 삼항 결과에 추가 차원이 필요하다고 생각하면 도움이 될 수 있습니다.
George

답변:


4

나는 삼각형의 역할이 무엇인지 이해하지 못합니다. 의사 소통 또는 시각화하려고 무엇입니까?

삼각형의 모든 점은 두 가지 제약 조건을 충족해야합니다. 각 차원에서 0과 1 사이의0θ1) 및 모든 합계는 1 (θ0+θ1+θ2=1).

내가 마침내 이해 한 방법은 다음과 같습니다.

그림

따라서 (a)는 θ1,2,3좌표로. 범위는 0과 1 사이입니다.

(b)에서 삼각형이 표시됩니다. 이것이 우리의 단순한 것입니다.

(c)는 두 번째 기준을 충족하는 단일체에 "배치"되는 두 가지 예를 보여줍니다 (최대 1 개까지).

(d)는 단일 선에 대한 다른 예제 포인트를 보여줍니다.

(e)에서는 이전에 표시된 모든 예제 포인트와 함께 단면을 2 차원 삼각형으로 투영하려고했습니다.

그것이 더 의미가 있기를 바랍니다 :)


2
좋은 사진. 당신인가요? 그렇지 않다면 참조를 제공해 주시겠습니까?
Tim

1
감사. 그것은 내 (잉크 스케이프를 사용하여 그린), 필요한 경우 SVG를 제공 할 수 있습니다 ...
John Doe

2

그래프 2.14 (a)는 각 축에 3 개의 정점으로 만들어진 평면을 보여줍니다. 원점에서 정점의 거리는θi, 중 하나에 해당 k=3클래스. 분홍색 평면으로 둘러싸인 영역과 축 평면은 (벡터) 확률입니다.θ. 이제 그 평면을 기울여 독자에게 가장 가까운 얼굴 인 분홍색 평면이있는 피라미드가 페이지에 평평하게 놓였다 고 가정합니다. 그런 다음 페이지에서 "튀어 나오는"3 차원을 억제하고 대신베이스에서 표면까지의 거리가 더 긴 고밀도 영역이 더 빨간색이되도록 삼각형의 색상을 지정하십시오. 그것이 그래프 2.14 (b)와 2.14 (c)가 보여주는 것입니다. 빨간색이 정점 근처에 집중 될수록 해당 정점과 관련된 클래스가 더 가능성이 높습니다. 마찬가지로, 빨간색 영역이 정점에 그리 가깝지 않은 경우 이벤트가 클래스의 멤버십 가능성이 높을 가능성은 특히 없습니다.

그러나이 피라미드는 Dirichlet 분포를 한 번만 실현 한 것으로 만 의미가 있습니다. 같은 분포에서 다시 그리면 길이가 다른 피라미드가 나올 수 있습니다θ각 정점에. (a)와 (b) / (c)의 주요 차이점은 (a) 한 번의 벡터 그리기 확률을 그래픽으로 표시한다는 것입니다.θ. 그래프 (b)와 (c)는 값의 확률 밀도를 보여줍니다θ 에서 k=3 심플 렉스, 즉 모든 값에 대한 확률 밀도 함수를 제시하려고합니다. θ지원합니다. (b)와 (c)를 생각하는 한 가지 방법은 평평한 분홍색 평면과 피라미드 표면 사이의 평균 높이에 따라 추가 붉은 색을 갖는 점으로,θDir(α).


일부 요점은 여전히 ​​명확하지 않습니다. 어쩌면 내 약한 영어의 사촌. "분홍색 평면과 축의 평면으로 둘러싸인 영역이 밀도입니다." 분홍색 비행기 아래 피라미드의 빈 공간입니까? 또한 "밀도"? 무슨 소리 야? 내가 이해하는 것처럼 dir (x1, x2, x3)이 하나의 값이라는 점에서 밀도는 어떻게 그래프에 표시됩니까?
잭 트웨인

그렇습니다. 분홍색 평면과 2.14 (a)에서 검은 선으로 형성된 평면 사이는 제가 설명하려고했던 피라미드의 공간입니다. 혼란을 드려 죄송합니다!
Sycorax는 Reinstate Monica

내가 뭘 아직 분명하지 않다 더 설명하기 위해 내 게시물을 편집합니다
잭 트웨인

분홍색 영역은 책에서 설명한 지원과 정확히 같습니다. theta_k <= 1이고 sum (theta_k) = 1이므로 일단 사진을 찍으면 user777이 완전히 옳습니다.
스크래치

@ user777 방금 게시물을 수정했습니다
Jack Twain
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.