답은 대칭 또는 비대칭 디리 클릿 분포를 가정하는지 (또는 더 기술적으로는 기본 측정 값 이 균일 한지) 여부에 따라 다릅니다 . 다른 것을 명시하지 않는 한, LDA의 대부분의 구현은 분포가 대칭이라고 가정합니다.
대칭 분포의 경우 알파 값이 높으면 각 문서에 단일 주제가 아닌 대부분 의 주제가 혼합되어있을 가능성이 있습니다 . 알파 값이 낮 으면 문서에 이러한 제약이 적으므로 문서에 주제 중 몇 개 또는 하나만 혼합되어있을 가능성이 높습니다. 마찬가지로 베타 값이 높으면 각 주제에 특정 단어가 아닌 대부분의 단어가 혼합되어있을 가능성이 높고, 값이 낮 으면 주제에 몇 단어 만 섞어있을 수 있습니다.
반면에 분포가 비대칭 인 경우 알파 값이 높으면 각 문서에 대해 특정 주제 분포 (기본 측정에 따라 다름)가 더 많을 가능성이 있음을 의미합니다. 마찬가지로 베타 값이 높으면 각 주제에 기본 측정 값으로 정의 된 특정 단어 조합이 포함될 가능성이 높습니다.
실제로 알파 값이 높으면 문서에 포함 된 주제와 관련하여 문서가 더 비슷해집니다. 베타 값이 높을수록 주제에 포함 된 단어가 더 비슷해집니다.
따라서, 알파 매개 변수는 문서의 주제 희소성 / 균일성에 대한 사전 신념을 명시합니다. "단어의 주제에서 상호 배타적"이라는 말의 의미가 확실하지 않습니다.
보다 일반적으로, 이들은 LDA 모델에 사용 된 디 리클 렛 분포에 대한 농도 파라미터 이다. 이것이 어떻게 작동하는지에 대한 직관적 인 이해를 돕기 위해이 프레젠테이션 에는 LDA에 대한 좋은 설명뿐만 아니라 멋진 삽화가 들어 있습니다.
( α1, α2, . . . , α케이)u = ( u1, U2, . . . , U케이)αα * u = ( α1, α2, . . . , α케이)α( α1, α2, . . . , α케이)( α1, α2, . . . , α케이)