답변:
세 가지 주요 접근 방식에 익숙합니다.
선험적으로. 선택할 수있는 4 개의 기본 쌍이 있으므로 HMM이 4 개의 상태를 갖도록 허용 할 수 있습니다. 또는 영어에는 44 개의 음소가 있으므로 음성 인식 모델에서 숨겨진 음소 레이어의 상태는 44 개입니다.
견적. 상태 수는 종종 HMM의 관찰 된 특징에 대한 간단한 클러스터링에 의해 미리 예측 될 수 있습니다. HMM 전이 행렬이 삼각형 인 경우 (종종 실패 예측의 경우), 상태 수에 따라 시작 상태에서 종료 상태까지의 총 시간 분포 모양이 결정됩니다.
최적화. 당신이 제안했듯이, 많은 모델이 만들어지고 적합하고 최고의 모델이 선택됩니다. 모델이 필요에 따라 상태를 추가하거나 폐기 할 수 있도록 HMM을 학습하는 방법론을 조정할 수도 있습니다.
추가 접근 방식은 셀 수없이 무한한 상태의 모델에서 샘플링하는 것입니다. 그런 다음 샘플러를 평균화하여 '얼마나 많은가'에 대한 답이 나타납니다.