(저는 통계 전문가입니다. 저는 수학자이자 프로그래머이며 순진한 베이지안 스팸 필터와 같은 것을 만들려고합니다.)
많은 곳에서 사람들이 베이 즈 정리의 방정식에서 분모를 분해하는 경향이 있음을 알았습니다. 그래서 이것 대신에 :
우리는 이것을 제시합니다 :
이 컨벤션은 이 위키 백과 기사 와 Tim Peters의 통찰력있는 게시물에서 사용 됩니다.
나는 이것으로 당황합니다. 왜 분모가 이렇게 분해 되었습니까? 그것이 어떻게 도움이 되나요? 스팸 필터의 경우 계산에있어 너무 복잡한 점은 무엇입니까 ?The probability that the word "cheese" appears in an email, regardless of whether it's spam or not