Hidden Markov Model은 어떤 기계 학습 알고리즘입니까?


12

신호 처리 클래스에서 자동 음성 인식을 위해 Hidden Markov Model 알고리즘을 사용했습니다. 이제 기계 학습 문헌을 살펴보면 알고리즘이 "분류", "클러스터링"또는 "회귀"로 분류되어 있음을 알 수 있습니다. HMM은 어느 버킷에 속합니까? 나는 문헌에 나열된 숨겨진 마르코프 모델을 보지 못했습니다.

답변:


14

"없음"또는 "분류 및 클러스터링"둘 다에 답장을 원합니다.

왜 "없음"입니까? HMM은 서포트 벡터 머신 또는 k- 평균과 같은 백에 없기 때문에.

서포트 벡터 머신 또는 k- 평균은 문제 (첫 번째 경우 분류, 두 번째 경우 클러스터링)를 해결하도록 특별히 설계되었으며 실제로 "예상 분류의 우수성"또는 "클러스터링의 우수성"기준을 최대화하기위한 최적화 절차입니다. . 아름다움은 기준과 최적화 절차의 선택에 있습니다. HMM은 알고리즘 자체가 아닙니다. 그것들은 벡터의 시퀀스에 대한 특정 종류의 확률 분포입니다-우리는 좋은 모수 추정과 한계 분포 계산 알고리즘을 알고 있습니다. 그러나 그들이 "클러스터링 (clustering)"또는 "분류 (classification)"패밀리에 있는지 여부는 가우시안 분포가 감독 된 학습인지 감독되지 않은 학습인지 묻는 것만 큼 우스운 일입니다.

왜 "분류 및 클러스터링"입니까? 다음과 같은 이유로 : 확률 분포이기 때문에 HMM을 베이지안 프레임 워크에서 분류에 사용할 수 있습니다. 숨겨진 상태로 모델을 구성하면 훈련 데이터의 일부 잠재 클러스터링을 해당 매개 변수에서 복구 할 수 있습니다. 더 정확하게:

HMM은 분류에 사용될 수 있습니다. 이는 베이지안 분류 프레임 워크를 간단하게 적용한 것이며 HMM은 데이터를 설명하는 확률 모델로 사용됩니다. 예를 들어, 큰 숫자의 발화 데이터베이스 ( "1", "2"등)가 있고 알려지지 않은 발화를 분류 할 수있는 시스템을 구축하려고합니다. 학습 데이터의 각 클래스 ( "1", "2")에 대해이 클래스의 학습 순서를 설명하는 HMM 모델의 매개 변수를 추정 한 다음 10 개의 모델로 끝납니다. 그런 다음 인식을 수행하려면 10을 계산합니다. 우도 (당신이 인식 할 순서가 모델에 의해 생성 된 가능성을 나타냅니다) 점수와 가장 높은 점수를 가진 모델은 당신에게 자리를 제공합니다.에서 HMM에에 Rabiner 자습서훈련 단계는 "문제 3", 분류 단계는 "문제 2"입니다.

HMM은 감독되지 않은 방식으로도 클러스터링과 유사한 것을 달성 할 수 있습니다. 시퀀스가 주어지면 HMM을 훈련시키고 훈련 과정이 끝나면 시퀀스에서 Viterbi 알고리즘을 실행하여 각 입력 벡터와 관련된 가능성이 가장 높은 상태를 얻습니다 (또는 훈련 과정 동안 ). 이것은 입력 시퀀스를 로 클러스터링합니다.γ k kkγkk- 평균을 통해 데이터를 실행하여 얻은 것과 달리 클러스터링은 시간 축에서 균질합니다. 예를 들어, 비디오 시퀀스의 각 프레임의 색상 히스토그램을 추출하고이 시퀀스에서이 프로세스를 실행하면 비디오를 장면에 해당하는 균일 한 시간 세그먼트로 분류 할 수 있습니다 (실제 비트는 장면 수 를 미리 설정해야합니다 ). 이 기술은 일반적으로 비디오 또는 음악 의 감독되지 않은 자동 구조 분석에 사용됩니다 .k


1

먼저 세 가지 옵션을 살펴 보겠습니다.

  • 분류 : 데이터가 속하는 사전 정의 된 클래스 세트의 클래스를 식별합니다.
  • 클러스터링 : 데이터가 속한 클래스 세트를 학습합니다.
  • 회귀 : 변수와 ​​하나 이상의 다른 관계를 찾습니다 .

Wikipedia의 HMM에 대한 설명은 다음 표와 같습니다.

여기에 이미지 설명을 입력하십시오

따라서 상태 (클래스) 수는 고정되어 있습니다.

이는 알고리즘이 클래스 (상태)의 수를 파악하려고 시도하지 않음을 의미하므로 개방형 클러스터링 (상태 수를 알 수없는)은 아닙니다.

그러나 @nikie가 지적했듯이 HMM은 클러스터링을 수행합니다.

실제로 회귀 컨텍스트에 존재하는 독립 변수가 없으므로 회귀 변수가 아닙니다.

내 대답은 HMM이 분류클러스터링 알고리즘이라는 것입니다. 회귀라고 생각하지 않습니다.


2
"고정 된 경우 클래스 수"에서 "알고리즘이 클래스가 무엇인지 알아 내려고하지 않습니다"로 어떻게 이동합니까? k- 평균 군집화의 클래스 수 역시 고정되어 있지만 분명히 군집 알고리즘입니다.
Niki Estner

필자는 고정형이 아닌 개방형 클러스터링에 익숙하다고 가정합니다. 답변을 업데이트합니다. 감사!
Peter K.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.