적절한 채점 규칙이 분류 설정에서 일반화에 대한 더 나은 추정치는 언제입니까?


9

분류 문제를 해결하는 일반적인 방법은 후보 모델 클래스를 식별 한 다음 교차 검증과 같은 일부 절차를 사용하여 모델 선택을 수행하는 것입니다. 일반적으로 가장 높은 정확도를 가진 모델을 선택하거나 다음과 같은 문제 별 정보를 인코딩하는 관련 기능을 선택합니다.Fβ.

최종 목표가 정확한 분류 자 ​​(정확도의 정의가 다시 문제에 의존하는 경우)를 생성하는 것으로 가정하고, 어떤 상황에서 정확도, 정밀도, 리콜과 같은 부적절한 것에 반해 적절한 점수 규칙 을 사용하여 모델 선택을 수행하는 것이 더 나은지 등? 또한 모델 복잡성 문제를 무시하고 모든 모델을 똑같이 고려한다고 가정합니다.

이전에는 절대 말하지 않았을 것입니다. 공식적인 의미에서 분류는 회귀보다 더 쉬운 문제이며, [1], [2]보다 이전보다 더 엄격한 범위를 도출 할 수 있습니다.). 또한, 확률을 정확하게 일치 시키려고 할 때 의사 결정 경계 가 잘못 되거나 과적 합 될 수 있습니다 . 그러나 여기 의 대화 와 그러한 문제와 관련한 커뮤니티의 투표 패턴을 기반 으로이 견해에 의문을 제기했습니다.

  1. 데 브로이, 루크 패턴 인식의 확률론. Vol. 31. Springer, 1996., 섹션 6.7
  2. Kearns, Michael J. 및 Robert E. Schapire. 확률 론적 개념에 대한 효율적인 배급없는 학습. 컴퓨터 과학의 기초, 1990. 절차, 31 연례 심포지움. IEEE, 1990.

()이 진술은 조잡 할 수 있습니다. 나는 구체적으로 양식의 레이블이 지정된 데이터를 의미합니다.S={(x1,y1),,(xn,yn)}xiXyi{1,,K}조건부 확률을 정확하게 추정하는 것보다 결정 경계를 추정하는 것이 더 쉬운 것 같습니다.

답변:


4

이것을 사이의 비교로 생각하십시오 t-테스트 / 윌 콕슨 테스트 및 정중앙 테스트. 중앙값 테스트는 최적의 분류 (연속 변수의 중앙값 위 또는 아래)를 사용하여 손실 만1π샘플 정보의 중앙값과 다른 지점에서 이분법 화하면 훨씬 더 많은 정보가 손실됩니다. "정확하게"분류 된 비율과 같은 부적절한 점수 규칙을 사용하는 것이 최대2π 또는 약 23실력 있는. 이로 인해 잘못된 피처를 선택하고 허위 인 모델을 찾을 수 있습니다.


나는 이분법이 왜 관련이 있는지 이해할 수 없다고 생각합니다. 궁극적으로 목표는 분류기를 선택하는 것입니다h 일부 가설 클래스에서 H 그런 P(x,y)D(h(x)y) 유한 샘플이 주어지면 최소입니다 S 에 따라 배포 된 예들로 구성 D.
alto

2
문제는 분류 (위험 예측과 반대로)가 불필요한 이분법 화라는 것입니다.
Frank Harrell

따라서 목표가 일부 유틸리티 함수와 관련하여 확률을 정확하게 일치시키지 않는 Bayes 최적의 의사 결정이라는 목표가 있다면이 질문에 대한 답이 결코 없다고 가정하는 것이 안전합니까?
alto

Bayes 최적의 결정을 위해서는 잘 보정 된 예측 위험이 필요하므로 두 가지가 연결됩니다. 최적의 결정은 파이프 라인에서 앞서 만들어진 이분법을 사용하지 않고 완전한 정보에 대한 조건, 예를 들어Prob(Y=1|X=x) 아니 Prob(Y=1|X>c).
Frank Harrell

1
좋은 토론. 일부 스팸 탐지기와 같은 경우에는 '불확실'할 수 있습니다. 의학적 진단 및 예후와 같은 문제의 임계 값에 더 관심이 있습니다.
Frank Harrell
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.