이벤트 예측을위한 숨겨진 Markov 모델


9

질문 : 숨겨진 Markov 모델의 현명한 구현 아래 설정이 있습니까?

전체 관측 시간 동안 108,000관찰 한 데이터 세트 (100 일 동안 수행)와 대략적인 2000이벤트가 있습니다. 데이터는 아래 그림과 같이 관찰 된 변수가 3 개의 개별 값 취할 수 있고 빨간색 열은 이벤트 시간, 즉 강조 표시합니다 .[1,2,]이자형

여기에 이미지 설명을 입력하십시오

그림에서 빨간색 사각형으로 표시된 것처럼 각 이벤트에 대해 { to }를 해부 하여이를 "사전 이벤트 창"으로 효과적으로 처리했습니다.이자형이자형5

HMM 교육 : Pg에서 제안한 다중 관측 시퀀스 방법을 사용하여 모든 "사전 이벤트 창"을 기반으로 HMM (Hidden Markov Model) 을 훈련 할 계획 입니다. Rabiner의 논문 273 . 바라건대, 이벤트로 이어지는 시퀀스 패턴을 캡처하는 HMM을 훈련시킬 수 있기를 바랍니다.

HMM 예측 : 그런 다음이 HMM을 사용 하여 새로운 날에 를 예측할 계획 입니다. 여기서 은 슬라이딩 윈도우 벡터가되고 현재 시간 와 사이의 관측 값을 포함하도록 실시간으로 업데이트됩니다. 일이 계속되는대로 .영형[(영형에스이자형아르 자형V나는영형에스|H미디엄미디엄)]영형에스이자형아르 자형V나는영형에스5

"사전 이벤트 창"과 유사한 에 대해 증가 를 볼 것으로 예상됩니다 . 이를 통해 이벤트가 발생하기 전에 이벤트를 예측할 수 있습니다.영형[(영형에스이자형아르 자형V나는영형에스|H미디엄미디엄)]영형에스이자형아르 자형V나는영형에스


데이터를 분할하여 모델을 작성 (0.7) 한 다음 나머지 데이터에서 모델을 테스트 할 수 있습니다. 그냥 생각, 나는이 분야의 전문가가 아닙니다.
Fernando

네 감사합니다. 확실하지 않은 작업에 HMM이 더 적합합니다.
Zhubarb

@ Zhubarb 비슷한 문제를 다루고 있으며 HMM 접근법을 따르고 싶습니다. 이 일을 성공적으로 수행 한 곳은? 아니면 로지스틱 회귀 / SVM 등으로 마침내 반복 되었습니까?
Javierfdr

@ Javierfdr, 구현의 어려움과 알토가 그의 답변에서 강조하는 우려로 인해 구현하지 못했습니다. 본질적으로, HMM은 광범위한 생성 모델을 구축해야하는 부담이 있지만, 내 직감은 당면한 문제에 대한 것이지만, 제안한대로 차별적 모델 (SVM, 신경망 등)을 더 쉽게 벗어날 수 있습니다. .
Zhubarb

답변:


3

설명한 접근법의 한 가지 문제는 어떤 종류의 증가를 정의해야 하는가입니다. (영형) 의미가 있으며, 다음과 같이 어려울 수 있습니다. (영형)항상 일반적으로 매우 작습니다. 관심있는 이벤트가 발생하는 관찰 시퀀스의 경우 HMM1, 이벤트 발생 하지 않는 관찰 시퀀스의 경우 HMM2와 같이 두 개의 HMM을 학습하는 것이 좋습니다 . 그런 다음 관찰 순서가 주어집니다.영형 당신은 가지고

(HH미디엄1|영형)=(영형|H미디엄미디엄1)(H미디엄미디엄1)(영형)(영형|H미디엄미디엄1)(H미디엄미디엄1)
HMM2도 마찬가지입니다. 그런 다음 이벤트가 발생할 경우 예측할 수 있습니다
P(HMM1|O)>P(HMM2|O)P(HMM1)P(O|HMM1)P(O)>P(HMM2)P(O|HMM2)P(O)P(HMM1)P(O|HMM1)>P(HMM2)P(O|HMM2).

면책 조항 : 다음은 개인적인 경험에 근거한 것이므로 그대로 유지하십시오. HMM의 장점 중 하나는 가변 길이 시퀀스 및 가변 차수 효과 (숨겨진 상태 덕분)를 처리 할 수 ​​있다는 것입니다. 때때로 이것은 (많은 NLP 응용 프로그램에서와 같이) 필요합니다. 그러나 최근 5 개의 관측치 만 관심있는 이벤트를 예측하는 데 적합하다고 가정 한 것처럼 보입니다. 이 가정이 현실적이라면 전통적인 기술 (로지스틱 회귀, 순진 베이, SVM 등)을 사용하고 마지막 5 개의 관측치를 특징 / 독립 변수로 사용하는 것이 훨씬 더 운이 좋을 수 있습니다. 일반적으로 이러한 유형의 모델은 학습하기 쉽고 (내 경험상) 더 나은 결과를 생성합니다.


@ 알토, 감사합니다. 당신이 말했듯이, 나는 볼 것이다=영형((영형|h미디엄미디엄))와 같은 값 1=2504,2=2403,=2450등이 크게 증가한 것을 발견했습니다. 문제가 될 수 있습니다. 그 동안 HMM2 교육이 어려울 것이라고 생각합니다. HMM2에 대한 포인트 수 (이벤트 없음)는 훨씬 높으며 패턴이없고 잡음 만있을 수 있습니다. 어떻게 생각해? 추신 : 나는 임의로 5 in을 창 크기로 선택했습니다. 실제 구현보다 더 길 것 같습니다.
Zhubarb

1
@ Berkan 나는 당신이 언급 한 문제 (이벤트 시퀀스보다 더 많은 이벤트 시퀀스가 ​​없으며 이벤트에 대해 잡음이 없음)가 2 HMM 접근법을 배제해야한다고 생각하지 않습니다. 당신이 이전을했다면(H미디엄미디엄1)(이 점에서 원래의 대답을 업데이트했습니다)를 고려하면 불균형 클래스 분포 (이벤트보다 더 많은 이벤트 없음)를 조정해야 할 수도 있지만이를 처리하는 많은 방법이 있습니다. 참조 내가 예를 들어 준 대답을.
alto

@ Berkan 자신의 개인적인 경험을 바탕으로 창 크기는 고정 창 크기 에 대해이 문제에 대해 말한 내용을 기대 합니다. 분명히 내가 말한 모든 내용은 특정 문제에 대해 경험적으로 테스트해야합니다.
alto

답변을 업데이트 해 주셔서 감사합니다. 훨씬 명확 해졌습니다. 로그로 작업하므로 비교할 것입니다.영형((H미디엄미디엄1))+영형((영형|H미디엄미디엄1))>?영형((H미디엄미디엄2))+영형((영형|H미디엄미디엄2)). 지금,영형((H미디엄미디엄1)) 순방향 알고리즘을 사용하여 계산됩니다. 어떻게 계산합니까? 영형((H미디엄미디엄1))? 내가 임명하기에 앞서 ti인가?
Zhubarb

답변을 업데이트 해 주셔서 감사합니다. 훨씬 명확 해졌습니다. 로그로 작업하므로 비교할 것입니다.영형((H미디엄미디엄1))+영형((영형|H미디엄미디엄1))>?영형((H미디엄미디엄2))+영형((영형|H미디엄미디엄2)). 지금,영형((H미디엄미디엄1))순방향 알고리즘을 사용하여 계산됩니다. 주파수를 기반으로 간단한 MLE을 사용하여 log (P (HMM1))를 계산합니까? 즉, 주어진 경우H미디엄미디엄1=(52,000)/108,000여기서 분자는 HMM1에 해당하는 포인트 수이고 분모는 데이터 세트의 크기입니다.
Zhubarb
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.