답변:
순진한 베이 즈 분류 (NBC)를 수행하는 방법에는 여러 가지가 있습니다. NBC의 일반적인 기술은 25 번째 백분위 수 미만의 값에 1, 25 ~ 50 번째 2, 50 ~ 75 번째 a 3, 75 번째 백분위 수 a 4보다 큰 값 (사 분위수)을 사 분위수로 다시 코딩하는 것입니다. 따라서 단일 객체는 빈 Q1, Q2, Q3 또는 Q4에 하나의 카운트를 입금합니다. 계산은이 범주 빈에 대해서만 수행됩니다. 빈 개수 (확률)는 변수 값이 지정된 빈 내에있는 샘플 수를 기준으로합니다. 예를 들어, 일련의 객체가 피처 X1에 대해 매우 높은 값을 가지면 X1의 Q4에 대해 빈에 많은 빈 개수가 생깁니다. 반면에 다른 객체 집합에 기능 X1에 대한 값이 낮 으면 해당 개체는 기능 X1의 Q1에 대해 많은 수의 저장소에 저장됩니다.
그것은 실제로 영리한 계산이 아니며, 연속적인 값을 이산으로 분리하고 그 이후에 악용하는 방법입니다. Gini 지수와 정보 게인은 이산화 후 쉽게 계산하여 가장 유용한 정보, 즉 max (Gini)를 판별 할 수 있습니다.
그러나 NBC를 수행하는 방법에는 여러 가지가 있으며, 서로 다른 방법이 많이 있습니다. 그래서 당신은 대화 나 논문에서 어떤 것을 구현했는지 말하면됩니다.
Naive Bayes의 핵심은 영웅적인 조건부 가정입니다.
절대로 가 이산되어서 는 안됩니다 . 예를 들어 Gaussian Naive Bayes 는 각 범주 에 다른 평균과 분산이 있다고 가정합니다 . 밀도 .
모수를 추정하는 방법에는 여러 가지가 있지만 일반적으로 다음과 같은 방법이 있습니다.