가설 검정은 분류 문제와 유사합니다. 즉, 우리는 유죄 대 비 유죄 관찰에 대한 두 가지 가능한 레이블이 있습니다. 비 유죄를 귀무 가설로 삼으십시오. 분류 관점에서 문제를 본다면 데이터를 고려하여 두 분류에 속하는 주제의 확률을 예측하는 분류기를 훈련시킬 것입니다. 그런 다음 확률이 가장 높은 클래스를 선택합니다. 이 경우 0.5 확률이 자연 임계 값이됩니다. False Positive vs. False Negative 오류에 다른 비용을 할당 한 경우 임계 값을 변경할 수 있습니다. 그러나 임계 값을 0.05로 설정하는 것만 큼 극단적으로 진행되는 경우는 거의 없습니다. 즉, 확률이 0.95 이상인 경우에만 클래스를 "Guilty"에 할당합니다. 하지만 내가 잘 이해한다면 이것이 우리가 가설 검정의 문제와 같은 문제를 볼 때 우리가 표준 관행으로하는 일입니다. 후자의 경우, "Guilty"레이블 지정과 동등한 "Non-Guilty"레이블은 "Non-Guilty"일 가능성이 5 % 미만인 경우에만 지정하지 않습니다. 그리고 만약 우리가 진실로 무고한 사람들을 유죄하는 것을 피하고 싶다면 이것이 의미가있을 것입니다. 그러나 왜이 규칙이 모든 도메인과 모든 경우에 우선해야합니까?
채택 할 가설을 결정하는 것은 데이터가 주어진 진실의 평가자를 정의하는 것과 같습니다. 최대 가능성 추정에서 우리는 데이터가 주어질 가능성이 높은 가설을 받아들입니다. 아래 그래프를 참조하십시오 :
최대 우도 접근 방식을 사용하면 예측 변수의 값이 3보다 큰 경우 (예 : 4),이 값의 귀무 가설에서 도출 된 확률이 0.05보다 클 경우이 예에서는 대립 가설을 선호합니다.
그리고 제가 글을 시작한 예는 아마도 감정적으로 고발 될 것이지만, 우리는 기술 향상과 같은 다른 경우를 생각할 수 있습니다. 데이터에서 새로운 솔루션이 개선 될 확률이 그렇지 않을 확률보다 크다고 말할 때 Status Quo에 이러한 이점을 제공해야하는 이유는 무엇입니까?