@bean의 짧은 대답은 그것을 잘 설명합니다. 그러나 저는 Resnik and Hardisty가 시작한 논문 Gibbs Sampling의 1.1 절을 지적하고 싶습니다 . 나는이 논문에서 약간의 수정으로 몇 줄을 쓰고 있습니다 (이 답변은 완전성을 위해 OP가 알고있는 것들을 거의 반복하지 않습니다)
MLE
공식적으로 MLE는 관측 된 데이터를 생성 할 가능성이 가장 높은 모델 매개 변수를 선택합니다.
지도
추정 된 MAP는 관측 된 데이터가 주어질 가능성이 가장 높은 선택입니다. MLE과 달리 MAP 추정은 Bayes 's Rule을 적용하므로 추정치에서 매개 변수가 사전 확률 분포의 형태로 예상되는 것에 대한 사전 지식을 고려할 수 있습니다.
잡기
MLE 및 MAP 추정치는 각각 "최고"의 정의에 따라 최상의 추정치를 제공합니다. 그러나 MLE이든 MAP이든 단일 추정값을 사용하면 정보가 삭제됩니다. 원칙적으로, 매개 변수는 (도메인으로부터) 임의의 값을 가질 수 있습니다. 모수의 단일 추정값이 아니라 전체 분포를 고려하면 더 나은 추정치를 얻지 못할 수 있습니까? 그렇게하면 관측 된 데이터 X에서 연결할 수있는 매개 변수에 대한 모든 정보를 사용하게됩니다.
따라서이 캐치에서는 아무 것도 사용하지 않을 수 있습니다. 또한 bean과 Tim이 이미 언급했듯이 둘 중 하나 를 사용해야 할 경우 이전에 얻은 경우 MAP을 사용하십시오. 사전이 없으면 MAP이 MLE로 줄어 듭니다. Conjugate priors는 문제를 분석적으로 해결하는 데 도움이됩니다. 그렇지 않으면 Gibbs Sampling을 사용하십시오.