기대 최대화 알고리즘이 사용되는 이유는 무엇입니까?


22

내가 아는 것으로부터 EM 알고리즘을 사용하여 가능성의 매개 변수와 관련하여 부분 도함수를 0으로 설정할 때 최대 가능성을 찾기 위해 분석적으로 해결할 수없는 일련의 방정식이 제공됩니다. 그러나 언급 된 일련의 방정식의 제약과 관련하여 최대한의 가능성을 찾기 위해 수치 기술을 사용하는 대신 EM 알고리즘이 필요합니다.

답변:


20

문제는 합법적이며 EM 알고리즘을 처음 배웠을 때도 같은 혼란을 겪었습니다.

일반적으로 EM 알고리즘은 모델의 일부 변수가 "잠재적"이거나 알 수없는 경우 파라 메트릭 모델의 가능성 함수를 최대화 할 수있는 반복 프로세스를 정의합니다.

이론적으로 동일한 목적으로 최소화 알고리즘을 사용하여 모든 모수에 대한 최대 우도 함수를 수치 적으로 찾을 수 있습니다. 그러나 실제 상황에서이 최소화는 다음과 같습니다.

  1. 훨씬 더 계산 집약적
  2. 덜 견고

EM 방법의 가장 일반적인 적용은 혼합 모델을 맞추는 것입니다. 이 경우 각 샘플을 컴포넌트 중 하나에 "잠재적 인"변수로 할당하는 변수를 고려하면 문제가 크게 단순화됩니다.

예를 보자. 2 개의 정규 분포의 혼합물에서 추출한 N 개의 샘플 있습니다. EM이없는 파라미터를 찾으려면 다음을 최소화해야합니다.에스={에스나는}

로그(엑스,θ)=로그[에이1특급((엑스μ1)22σ12)+에이2특급((엑스μ2)22σ22)]

반대로 EM 알고리즘을 사용하여 먼저 각 샘플을 구성 요소에 "할당"하고 ( E 단계 ) 각 구성 요소를 개별적으로 적합 (또는 가능성최대화 )합니다 ( M 단계 ). 이 예에서 M 단계 는 단순히 σ k 를 찾기위한 가중 평균 입니다. 이 두 단계의 반복을 최소화 할 수있는 간단하고 강력한 방법입니다 - 로그 L ( X , θ ) .μ케이σ케이로그(엑스,θ)


12

EM도 수치 방법이기 때문에 일부 수치 기술을 사용하는 대신 EM이 필요하지 않습니다. 따라서 Newton-Raphson을 대체하지 않습니다. EM은 데이터 매트릭스에 결 측값이있는 특정 경우를위한 것입니다. 샘플 고려 조건부 밀도를 갖는 F X를 | Θ ( x | θ ) . 그런 다음 이의 로그 우도는 l ( θ ; X ) = l o g f X | Θ엑스=(엑스1,...,엑스)에프엑스|Θ(엑스|θ) 이제 X 가 관측 된 데이터 Y 와 누락 된 (또는 잠재 된) 변수 Z 로 구성되어 X = ( Y , Z ) 와 같은 완전한 데이터 세트가 없다고 가정합니다. 관측 된 데이터의 로그 우도는 l o b s ( θ , Y ) = l o g f X | Θ ( Y , z | θ ) ν z (

(θ;엑스)=영형에프엑스|Θ(엑스|θ)
엑스와이엑스=(와이,) 일반적으로 직접이 적분을 계산할 수 있으며위한 폐쇄 형 솔루션을 얻을 것이다 L O S ( θ , Y가 ) . 이를 위해 EM 방법을 사용합니다. i 번반복되는 두 단계가 있습니다. 이 ( i + 1 ) t h 단계에서 이들은 Q ( θ | θ ( i ) ) = E θ ( i ) [ l ( θ 를 계산하는 예상 단계입니다
영형에스(θ,와이)=영형에프엑스|Θ(와이,|θ)ν()
영형에스(θ,와이)나는(나는+1)h 여기서, θ ( i ) i t h 단계에서의 Θ 의 추정치이다. 이어서 극대화가 최대화되는 계산 단계 Q를 ( θ | θ ( I ) ) 과 관련하여하기 θ 및 세트 θ ( I + 1 ) = m X의 Q ( θ를 | θ I )
(θ|θ(나는))=이자형θ(나는)[(θ;엑스|와이]
θ(나는)Θ나는h(θ|θ(나는))θθ(나는+1)=에이엑스(θ|θ나는). 그런 다음 방법이 예상 값이 될 때까지이 단계를 반복하십시오.

방법에 대한 자세한 정보가 필요하면 해당 속성, 증명 또는 응용 프로그램에서 해당 Wiki 기사를 살펴보십시오 .


1
+1 ... EM은 결 측값만을위한 것이 아닙니다.
Glen_b-복지 주 모니카

@Andy : 누락 된 데이터의 경우를 고려하더라도 부분 파생 상품이 0 인 지점을 찾기 위해 일반 수치 방법을 사용하는 이유가 여전히 이해되지 않습니다.
user782220

감사합니다 글렌, 나는 결 측값 / 잠재적 변수의 맥락에서만 그것을 알고있었습니다. @ user782220 : 로그 우도 도함수의 닫힌 양식 솔루션을 가질 수없는 경우 도함수를 0으로 설정하면 모수를 식별 할 수 없습니다. 이 경우 숫자 방법을 사용하는 이유입니다. 설명과 예는 여기 강의를 참조하십시오 : people.stat.sfu.ca/~raltman/stat402/402L5.pdf
Andy

1

EM 은 종종 해당 모델에서 주어진 데이터 세트의 확률을 최대화하는 모델의 매개 변수를 직접 계산하는 것이 불가능하거나 불가능하기 때문에 사용됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.