Naive Bayes 예측자는 다음 공식을 사용하여 예측합니다.
여기서 는 정규화 인자입니다. 이를 위해서는 데이터에서 파라미터 P ( X i = x i | Y = y ) 를 추정해야합니다 . k -smoothing 으로이 작업을 수행 하면 추정치를 얻습니다.
이 곳에 가능한 값 X 나 . 나는 이것으로 괜찮습니다. 그러나 이전에는
여기서 존재 데이터 세트의 예는. 우리는 왜 이전을 부드럽게하지 않습니까? 또는 오히려, 않습니다 우리는 이전을 원활하게? 그렇다면 어떤 스무딩 파라미터를 선택합니까? 우리는 다른 계산을하고 있기 때문에 k 도 선택하는 것은 약간 어리석은 것처럼 보입니다 . 합의가 있습니까? 아니면 너무 중요하지 않습니까?