왜 Bayes 분류기를 사용하여 달성 할 수있는 최고의 성능을 달성 할 수 있습니까? 이에 대한 공식적인 증거 / 설명은 무엇입니까?
일반적으로 데이터 집합 디 구성 여겨진다 엔 IID 샘플 엑스나는 하여 데이터를 생성하는 분포. 그런 다음 주어진 데이터에서 예측 모델을 구축 : 샘플 주어진 엑스나는 , 당신은 클래스 예측 F를 ( X I ) , 샘플의 실제 클래스 인 반면 , f는 ( X I ) .에프^( x나는)에프( x나는)
에프^선택된f^F^
D
xiee(model)=P[f(X)=model(X)],
X
xvD
P(v∣D)=∑f^P(v∣f^)P(f^∣D).
- P(v∣f^)01f^x
- P(f^∣D)
- f^
P(v∣D)
xv^=argmaxv∑f^P(v∣f^)P(f^∣D).
ve(f^)
우리는 항상 다른 모든 분류기의 성능을 비교하기 위해 Bayes 분류기를 벤치 마크로 사용합니다.
P(v∣D)