Laplacian smoothing을 사용하여 텍스트 분류를위한 Naive Bayes 알고리즘을 구현하고 있습니다. 내가 가진 문제는 많은 작은 분수를 곱하기 때문에 확률이 0에 가까워진다는 것입니다. 따라서 확률은 결국 0이됩니다. 문서와 훈련 세트 내에 여러 단어가 있기 때문입니다.
이로 인해 텍스트를 분류 할 수 없습니다. 이 문제를 해결할 수있는 방법이 있습니까? 구현에 문제가 있습니까?
... 부동 소수점 산술을 피할 수 있습니다.
msdn.microsoft.com/en-us/magazine/jj891056.aspx 여기에 쉬운 답변이 있습니다.
—
Roshan Mehta