과학자들은 올바른 Hidden Markov Model 매개 변수와 토폴로지를 어떻게 사용할 수 있습니까?


10

유전자를 찾는 것과 같은 게놈 서열에서 숨겨진 마르코프 모델이 어떻게 사용되는지 이해합니다. 그러나 특정 Markov 모델을 만드는 방법을 이해하지 못합니다. 모델에 몇 개의 상태가 있어야합니까? 가능한 전환 수는 몇 개입니까? 모델에 루프가 있어야합니까?

모델이 최적이라는 것을 어떻게 알 수 있을까요?

그들은 서로 다른 10 가지 모델을보고 그 10 가지 모델을 벤치마킹하고 최고의 모델을 발표한다고 생각합니까?

답변:


6

세 가지 주요 접근 방식에 익숙합니다.

  1. 선험적으로. 선택할 수있는 4 개의 기본 쌍이 있으므로 HMM이 4 개의 상태를 갖도록 허용 할 수 있습니다. 또는 영어에는 44 개의 음소가 있으므로 음성 인식 모델에서 숨겨진 음소 레이어의 상태는 44 개입니다.

  2. 견적. 상태 수는 종종 HMM의 관찰 된 특징에 대한 간단한 클러스터링에 의해 미리 예측 될 수 있습니다. HMM 전이 행렬이 삼각형 인 경우 (종종 실패 예측의 경우), 상태 수에 따라 시작 상태에서 종료 상태까지의 총 시간 분포 모양이 결정됩니다.

  3. 최적화. 당신이 제안했듯이, 많은 모델이 만들어지고 적합하고 최고의 모델이 선택됩니다. 모델이 필요에 따라 상태를 추가하거나 폐기 할 수 있도록 HMM을 학습하는 방법론을 조정할 수도 있습니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.