히든 마르코프 모델에서 "최상의"모델을 선택하기위한 기준


12

데이터의 잠재 상태 수를 추정하기 위해 HMM (Hidden Markov Model)에 맞추려고하는 시계열 데이터 세트가 있습니다. 이 작업을 수행하는 의사 코드는 다음과 같습니다.

for( i in 2 : max_number_of_states ){ 
    ...
    calculate HMM with i states
    ...
    optimal_number_of_states = "model with smallest BIC"
    ...
}

이제 일반적인 회귀 모델에서 BIC는 가장 교묘 한 모델을 선호하는 경향이 있지만 HMM의 경우 그것이 무엇인지 잘 모르겠습니다. 실제로 BIC 기준이 어떤 종류의 HMM인지 알고 있습니까? 또한 AIC 및 가능성 값도 얻을 수 있습니다. 실제 총 주 수를 추론하려고하기 때문에 이러한 기준 중 하나가 다른 목적보다 "더 나은"것입니까?

답변:


11

여기서는 출력 변수가 범주 형이라고 가정하지만 그렇지 않을 수도 있습니다. 그러나 일반적으로 HMM이 사용되는 것을 보았을 때 튜닝을 통해 선택되는 대신 상태 수를 미리 알 수 있습니다. 일반적으로 그것들은 관찰되지 않는 잘 알려진 변수에 해당합니다. 그러나 이것이 실험을 할 수 없다는 것을 의미하지는 않습니다.

BIC (및 AIC)를 사용할 때의 위험은 Px (P-1) 파라미터가있는 전이 확률 행렬 (P 상태의 경우)이 있으므로 모델의 자유 파라미터 수에 대한 k 값이 상태 수에 따라 2 차적으로 증가한다는 것입니다 ) 및 각 상태에 따른 출력의 각 범주에 대한 출력 확률. 따라서 AIC와 BIC가 올바르게 계산되면 k 가 빠르게 올라갑니다.

충분한 데이터가있는 경우 홀드 아웃 샘플 테스트와 같은 상태 수를 더 부드럽게 조정하는 것이 좋습니다. 또한 우도 통계를보고 정점을 시각적으로 확인하고 싶을 수도 있습니다. 또한 데이터가 크면 BIC를 더 작은 모델로 푸시합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.