답변:
Gumbel-max 트릭을 사용하여 로그 공간 을 남기지 않고 로그 확률이 주어진 범주 형 분포에서 샘플링 할 수 있습니다 . 비정규 화 된 로그 확률 , softmax 함수를 사용하여 적절한 확률로 변환 될 수 있습니다.
그러한 분포로부터 시료 같은 경우 사실을 이용할 수 표준 Gumbel와 분포 찍은 독립 샘플 위치에 의해 매개 변수화된다 ,
그런 다음 (아래 참조 참조)
우리는 걸릴 수 있습니다
확률로 매개 변수화 된 범주 형 분포의 표본으로 이 접근 방식은 Ryan Adams 와 Laurent Dinh의 블로그 항목에 자세히 설명되어 있으며 Chris J. Maddison, Daniel Tarlow 및 Tom Minka 는 신경 정보 처리 시스템 회의 (2014) 에서 연설 ( 슬라이드 )을 했으며 A * 라는 제목 의 논문을 썼습니다. 이 아이디어를 일반화 한 샘플링 (2016 년 Maddison, 2016 년 Maddison, Mnih and Teh, 2016 년 Jang and Poole, 2016)은 자신을이 속성을 처음 설명한 사람들 중 한 사람이라고 언급 한 Yellott (1977)를 언급합니다.
를 취하여 역변환 샘플링 을 사용하여 구현하는 것은 매우 쉽습니다. 여기서 는 균일 분포에서 가져옵니다 . 범주 형 분포에서 샘플링하는 데 가장 시간 효율적인 알고리즘은 아니지만 일부 시나리오에서 이점이 될 수있는 로그 공간을 유지할 수 있습니다.
Maddison, CJ, Tarlow, D. 및 Minka, T. (2014). A * 샘플링. [In :] 신경 정보 처리 시스템의 발전 (pp. 3086-3094).
지엘 옐로 (1977). Luce의 선택 공리, Thurstone의 비교 판단 이론 및 이중 지수 분포 간의 관계 수학 심리학 저널, 15 (2), 109-144.
Maddison, CJ, Mnih, A., & Teh, YW (2016). 구체적 분포 : 불연속 랜덤 변수의 연속 완화. arXiv 프리 프린트 arXiv : 1611.00712.
장 E., 구, S. & Poole, B. (2016). Gumbel-Softmax를 통한 범주 재 파라미터 화. arXiv 프리 프린트 arXiv : 1611.01144.
CJ 매디슨 (2016). Monte Carlo의 푸 아송 공정 모델. arXiv 프리 프린트 arXiv : 1602.05986.
exp
정밀도가 떨어질 수 있으며 [1.0, 3.45e-66, 0.0, 7.54e-121] . 이 경우에도 강력한 답변을 제시하고 싶습니다. 하지만 지금은 귀하의 답변을지지합니다.