숨겨진 Markov 모델과 Markov 전환 모델 및 State-Space 모델…?


18

석사 논문의 경우, 나는 혈청 학적 상태에 의해 정의 된 다른 상태들 사이의 천이에 대한 통계적 모델을 개발하고 있습니다. 지금은 내 질문이 더 일반적이고 이론적 이므로이 맥락에 대해 너무 많은 세부 정보를 제공하지 않습니다. 어쨌든, 직관은 HMM (Hidden Markov Model)을 사용해야한다는 것입니다. 저의 모델을 구성하는 데 필요한 문헌 및 기타 배경 연구를 진행하면서 제가 겪는 문제는 용어에 대한 혼란과 다양한 유형의 숨겨진 프로세스 모델 간의 정확한 차이입니다. 나는 그것들을 구별하는 것 (예시적인 예) 만 모호하게 알고 있습니다. 또한, 적어도 제가 문학에서 본 것으로부터, 이런 유형의 모델링에 대해 매우 비표준적인 어휘가 쌓여있는 것 같습니다.

그래서 저는 사람들이 저에게이 용어들 중 일부를 명확하게 해 줄 수 있기를 바랍니다. 나는 많은 질문을 가지고 있지만, 한두 가지가 만족스럽게 대답하면 나머지는 결과적으로 풀릴 것이라고 추측합니다. 나는 이것이 오래 걸리지 않기를 바란다. 사회자가 내가 이것을 여러 개의 게시물로 나누기를 원한다면 내가 할 것입니다. 어쨌든 나는 질문을 굵게 표시 한 다음 문헌 검색 중에 발견 한 질문에 대해 자세하게 설명했습니다.

따라서 특별한 순서는 없습니다.

1) "숨겨진 프로세스 모델"이란 정확히 무엇입니까?

"숨겨진 프로세스 모델"은 여러 가지 유형의 통계 모델을 설명하는 데 사용할 수있는 포괄적 인 용어, "중복 시스템, 잠재적으로 숨겨지고 선형 적으로 부가적인 공정 "([1]). 실제로, [2]는 "숨겨진 프로세스 모델"을 "상태-공간 모델 또는 숨겨진 Markov 모델을 가리키는 일반적인 용어"로 정의합니다. [1] 은닉 마르코프 모델은 이진 상태에 대한 추론을 위해 특별히 숨겨진 숨겨진 프로세스 모델의 하위 유형이라고 추론하는 것으로 보인다. 숨겨진 프로세스 모델은 숨겨진 Markov 모델의 일반화 인 것 같습니다. 때때로 "숨겨진 프로세스 모델"과 "

내 직감이 맞습니까? 그렇지 않다면 아무도이 방법을 더 명확하게 설명하는 참조가 있습니까?

2) 은닉 마르코프 모델과 상태 공간 모델의 차이점은 무엇입니까?

다시 [2]로 돌아 가기 (논문 자체가 특히 권위있는 것처럼 보이지 않기 때문에 논문이 명료 한 용어집을 가지고 있기 때문에; 그것은 한 문장 정의의 편리한 소스 일 뿐임)의 차이점은 은닉 마르코프 모델은 상태가 마르코 비안 인 특정 유형의 상태 공간 모델입니다 (마코프 프로세스의 순서, 즉 1 차, ..., k 차 순서에 대한 명확한 제한은없는 것 같습니다). 여기서 상태 공간 모델은 "두 개의 시계열을 병렬로 실행하는 모델로, 하나는 실제 상태 (잠재적)의 동적을 캡처하고 다른 하나는 이러한 기본이지만 알 수없는 상태에서 이루어진 관측치로 구성됩니다."로 정의됩니다. 해당 상태가 Markov 속성도 표시하면 숨겨진 Markov 모델입니다.

그러나, [3]은 상태-공간 모델과 은닉 마르코프 모델 간의 차이를 잠복 상태의 특성과 관련이있는 것으로 정의한다. 여기서 은닉 마르코프 모델은 불연속 상태를 처리하고 상태 공간 모델은 연속 상태를 처리합니다. 그렇지 않으면 개념적으로 동일합니다.

이것들은 두 가지 매우 다른 정의 인 것 같습니다. 하나에서, 숨겨진 마르코프 모델은 상태-공간 모델의 하위 유형이고, 다른 하나에서는 더 넓은 종류의 숨겨진 프로세스 모델의 다른 인스턴스 일뿐입니다. 이 중 올바른 것은 무엇입니까? 내 직감에 따라 [2]와는 달리 [3]을 (를) 따르겠다고 지적하지만이를 지원하는 신뢰할 수있는 출처를 찾을 수 없습니다.

3) "Markov 전환 모델"이란 무엇입니까?

많은 소스에서 나온 또 다른 용어는 "Markov transition model"입니다. 교과서 에서이 문구를 찾을 수 없었지만 저널 기사에 많이 나타납니다 (단순히 Google에 연결하여 확인하십시오). 나는 용어에 대한 엄격한 정의를 찾을 수 없었습니다 (종이가 발견되면 다른 논문을 인용하여 다른 논문을 인용하여 제게 아무데도 도움이되지 않는 PubMed 토끼 구멍을 보내줍니다). 문맥에서 필자의 인상은 추론의 대상이 Markov 프로세스를 따르는 상태 간의 전이이고 숨겨진 Markov 모델이 특정 유형의 Markov 전이 모델로 간주 될 수있는 모델을 나타내는 매우 일반적인 용어라는 것입니다. . 그러나, 전이 모델, 히든 마르코프 모델 (Hidden Markov Model) 및 여러 유사한 용어를 상호 교환 적으로 사용하는 것으로 보입니다.

반면, [5]는 Markov 전환 모델과 숨겨진 Markov 모델에 대해 조금 다르게 이야기합니다. 저자들은 "전환 모델은 더 복잡한 숨겨진 Markov 모델의 결과를 해석하는 데 도움이되는 응답자 역학을 요약하는 방법을 제공합니다"라고 말합니다. 나는이 문구가 무엇을 의미하는지 완전히 이해하지 못하며, 논문의 다른 곳에서도 그에 대한 정당성을 찾을 수 없습니다. 그러나 그들은 Markov 전환 모델이 시간을 연속 변수로 사용하는 반면 숨겨진 Markov 모델은 시간을 이산 변수로 사용한다는 것을 암시하는 것처럼 보입니다 (직접 말하지는 않지만 R 패키지 'msm'을 사용하여 Markov 전환에 맞습니다) HMM의 R 패키지와 달리 시간을 지속적으로 처리하는 것으로 'msm'을 설명합니다.

4) Dynamic Bayesian Networks와 같은 다른 개념은 어디에 적합합니까?

Wikipedia에 따르면 Dynamic Bayesian Network는 "숨겨진 Markov 모델 및 칼만 필터의 일반화"입니다. 한편, 나는 "세계의 전체 상태를 하나의 숨겨진 상태 변수로 표현된다"동적 베이지안 네트워크의 특별한 경우로 정의 숨겨진 마르코프 모델 보았다 ( 동적 베이지안 시스템의 정의 및 HMM과의 관계를? ) . 나는이 관계를 일반적으로 이해하고 있으며 [6]에 의해 잘 설명되어있다.

그러나 나는이 관계가 더 넓은 사물에 어떻게 적용되는지 이해하는 데 어려움을 겪고 있습니다. 즉, HMM과 DBN 간의 이러한 관계를 고려할 때 상태 공간 모델과 숨겨진 프로세스 모델은이 둘과 어떤 관련이 있습니까? 숨겨진 마르코프 모델에 대해 여러 개의 "일반화"가있는 경우 이러한 여러 유형의 방법이 서로 관련이 있습니까?


참고 문헌 :

[1] Tom M. Mitchell, Rebecca Hutchinson, Indrayana Rustandi. "숨겨진 공정 모델". 2006. CMU-CALD-05-116. 카네기 멜론 대학교.

Oliver Giminez, Jean-Dominique Lebreton, Jean-Michel Gaillard, Remi Choquet, Roger Pradel. "숨겨진 프로세스 동적 모델을 사용하여 인구 통계 학적 매개 변수 추정" 이론적 인구 생물학. 2012. 82 (4) : 307-316.

바바라 잉겔 하르트. "숨겨진 Markov 모델 및 상태 공간 모델". STA561 : 확률 적 기계 학습. 듀크 대학교. http://www.genome.duke.edu/labs/engelhardt/courses/scribe/lec_09_25_2013.pdf

[4] Jeroen K. Vermunt. "통행 성 기분 평가 데이터의 분석에 응용하여 연속 시간에 다중 레벨 잠복 마르코프 모델링". 사회 통계 워크샵. 2012. 틸 뷔르흐 대학교. http://www.lse.ac.uk/statistics/events/SpecialEventsandConferences/LSE2013-Vermunt.pdf

[5] Ken Richardson, David Harte, Kristie Carter. "건강 및 노동력 전환 이해 : SoFIE 종단 데이터에 Markov 모델 적용" 공식 통계 연구 시리즈. 2012.

[6] 주빈 가라 마니. "숨겨진 Markov 모델 및 베이지안 네트워크 소개". 패턴 인식 및 인공 지능 저널. 2001. 15 (1) : 9-42.


반복 신경망을 사용해 볼 수도 있습니다. 음성 인식에서 일부는이를 HMM의 대체물로 성공적으로 사용했습니다.
Albert

제안 해 주셔서 감사합니다. 지금은 새로운 기술을 공부하기 전에 이러한 기술에 대한 내 질문을 명확히하고 싶습니다.
Ryan Simmons

그들은 같은 것을 참조합니다. 참조하시기 바랍니다 scholarpedia.org/article/State_space_model Sangdon을

2
@Ryan Simmons YouTube에서 Markov 체인 및 숨겨진 Markov 모델에 대한 mathematicalmonk (일명 Jeffrey Miller) 비디오를 확인하는 것이 좋습니다.
JimBoy

아마 지금까지 논문을 제출했을 것이므로이 질문에 스스로 대답 하시겠습니까? 나는 여기에 전문가의 답변을 원합니다.이 질문을 읽는 거의 800 명의 다른 사람들에게도 적용됩니다.
Ulf Aslak

답변:


4

다음은 Scholarpedia 웹 사이트 에서 인용 한 것입니다 .

상태 공간 모델 (SSM)은 잠재 상태 변수와 관측 된 측정 간의 확률 적 의존성을 설명하는 확률 적 그래픽 모델 클래스 (Koller and Friedman, 2009)를 나타냅니다. 상태 또는 측정은 연속적이거나 불연속적일 수 있습니다. “상태 공간”이라는 용어는 제어 공학 분야에서 1960 년대에 시작되었다 (Kalman, 1960). SSM은 확률 론적 프로세스를 통해 측정되거나 관찰되는 결정 론적 및 확률 론적 동적 ​​시스템을 분석하기위한 일반적인 프레임 워크를 제공합니다. SSM 프레임 워크는 광범위한 동적 시스템 문제를 해결하기 위해 엔지니어링, 통계, 컴퓨터 과학 및 경제에 성공적으로 적용되었습니다. SSM을 설명하는 데 사용되는 다른 용어는 HMM (숨겨진 Markov 모델) (Rabiner, 1989) 및 잠재 프로세스 모델입니다. 가장 잘 연구 된 SSM은 칼만 필터입니다.


3

I와 Alan Hawkes는 불연속 상태의 연속 된 Markov 프로세스에 대해 상당히 많은 글을 썼습니다. 우리의 물건은 단일 이온 채널 분자의 관측을 해석하는 문제에 관한 것이며 누락 된 짧은 사건의 정확한 처리를 포함합니다. 비슷한 이론이 신뢰성 이론에서도 작동합니다. 다른 문제에 적합 할 수도 있습니다. 참조는 http://www.onemol.org.uk/?page_id=175 를 참조하십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.