Naive Bayes 라는 일반 용어 는 각 기능의 특정 분포가 아니라 모델의 강력한 독립성 가정을 나타냅니다. Naive Bayes 모델은 사용하는 각 기능이 일부 클래스에서 조건부로 독립적 인 것으로 가정합니다. 좀 더 공식적으로, Naive Bayes 가정 하에서 클래스 c가 주어진 경우 ~ 피처를 관찰 할 확률을 계산 하려면 다음을 유지하십시오.f n에프1에프엔
P ( F1, . . . , f엔| c)= ∏나는 = 1엔P ( F나는| c)
이것은 Naive Bayes 모델을 사용하여 새로운 예제를 분류하려고 할 때 사후 확률이 작업하기가 훨씬 간단하다는 것을 의미합니다.
p ( c | f1, . . . , f엔) ∝ p ( c ) p ( f1| c). . . P( F엔| c)
물론 이러한 독립성에 대한 가정은 거의 사실이 아니며, 일부 모델이 왜 "아이디어 베이"모델로 언급 되었는가를 설명 할 수 있지만 실제로 Naive 베이 즈 모델은 복잡한 작업에서도 놀랍도록 잘 수행되었습니다. 독립 가정은 거짓입니다.
지금까지 각 기능의 분포에 대해서는 언급하지 않았습니다. 즉, 정의하지 않은 상태로 두었습니다 . 다항식 나이브 베이 즈 (Multinomial Naive Bayes) 라는 용어 는 각 가 다른 분포가 아닌 다항 분포 라는 것을 간단히 알려줍니다 . 텍스트의 단어 수와 같이 쉽게 숫자로 변환 될 수있는 데이터에 적합합니다.P ( F나는| c)P ( F나는| c)
Naive Bayes 분류기와 함께 사용했던 분포는 Guassian pdf이므로 Guassian Naive Bayes 분류기로 부를 수 있습니다.
요약하면 Naive Bayes 분류기는 모델의 각 기능에 대한 조건부 독립성을 나타내는 일반적인 용어 인 반면, Multinomial Naive Bayes 분류기는 각 기능에 대해 다항 분포를 사용하는 Naive Bayes 분류기의 특정 인스턴스입니다.
참고 문헌 :
스튜어트 제이 러셀과 피터 노비 그. 인공 지능 : 현대적 접근법 (2 판). 피어슨 교육. p. 참조 "멍청한 베이"와 Naive 베이 모델의 일반적인 정의 및 독립 가정에 대한 참조