최소 위험 분류기의 계산 임계 값?


11

두 클래스 및 에 속성 가 있고 분포가 및 합니다. 다음 비용 매트릭스에 대해 동일한 사전 경우 :C1C2xN(0,0.5)N(1,0.5)P(C1)=P(C2)=0.5

L=[00.510]

왜, 가 최소 위험 (비용) 분류기의 임계 값입니까?x0<0.5

이것은 내가 오해하는 나의 주 예입니다 (즉,이 임계 값에 어떻게 도달합니까?)

편집 1 : 우도 비율의 임계 값에 대해 P (C1) / P (C2)를 사용할 수 있다고 생각합니다.

편집 2 : Duda Book의 Pattern에 임계 값에 대한 텍스트를 추가합니다. 여기에 이미지 설명을 입력하십시오

답변:


4

비용 매트릭스

L=[00.510]c1c2predictionc1c2truth

진리가 클래스 때 클래스 예측 손실 은 이고, 진리가 클래스 때 클래스 예측 비용 은 입니다. 정확한 예측 비용은 없습니다. 입니다. 클래스 를 예측하기위한 조건부 위험 은c1c2L12=0.5c2c1L21=1L11=L22=0Rk

R(c1|x)=L11Pr(c1|x)+L12Pr(c2|x)=L12Pr(c2|x)R(c2|x)=L22Pr(c2|x)+L21Pr(c1|x)=L21Pr(c1|x)
경우 a 15 페이지 의이 참고 사항 을 참조하십시오 .

당신이 예측 위험 / 손실을 최소화하기 위해 그렇게 실수의 비용 (잘못된 예측 시간의 손실이 예측이 잘못되었다는 사후 확률의 그 경우 있다) 대안을 잘못 예측하는 비용보다c1L12Pr(c2|x)

L12Pr(c2|x)<L21Pr(c1|x)L12Pr(x|c2)Pr(c2)<L21Pr(x|c1)Pr(c1)L12Pr(c2)L21Pr(c1)<Pr(x|c1)Pr(x|c2)
두 번째 줄은 Bayes의 규칙 합니다. 감안할 때 동일 사전 확률 당신이 얻을 Pr(c2|x)Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0.5
12<Pr(x|c1)Pr(x|c2)

따라서 이 우도 비율이이 임계 값을 초과 하므로 관측치를 분류하도록 선택합니다 . 이제 가능성 비율 또는 속성 측면에서 "최고의 임계 값"을 알고 싶은지 확실하지 않습니다 . 답은 비용 함수에 따라 달라집니다. 및 , 인 불평등에서 가우시안 사용c1xσ1=σ2=σμ1=0μ2=1

12<12πσexp[12σ2(xμ1)2]12πσexp[12σ2(xμ2)2]log(12)<log(12πσ)12σ2(x0)2[log(12πσ)12σ2(x1)2]log(12)<x22σ2+x22σ22x2σ2+12σ2xσ2<12σ2log(12)x<12log(12)σ2
에 대한 예측 임계 값x당신이 거짓 예측에서 손실 즉, 동일한 경우에만 달성 할 수있다 검색 등 그런 다음에야 당신이 가질 수 있기 때문에 이고 를 얻습니다 .L12=L21log(L12L21)=log(1)=0x0<12

좋은 답변이지만 혼란 스러워요! 또는 를 선택하려면 어느 것이 맞습니까? x0=0.5x0<0.5
user153695

따라서 결정 경계 에서는 관측치가 클래스 1 또는 2에 있어야하는지 정확하게 알 수 없습니다 (정확히 경계에 있기 때문에). 따라서 또는 가 당신에게 달려 있다면 관측 값 가 클래스 1에 있어야 하는지 선택 하십시오. 충분히 큰 샘플을 사용하면 아주 적은 수의 관측으로 이러한 결과가 발생하므로 여백에서 결과가 어려워집니다. x0=0.5ix00.5x0<0.5
Andy

현상금을 설정 한 나의 모든 문제는 나의 교수진을 때리게합니다. 계산 된 이고 허용하지 않음 문제의 편집 내용을 참조하십시오. 얇은 임계 값은 이어야합니다 . x0<0.5x0=0.5x0<0.5
user153695

아마 0.5-ln :)
user153695 15:08에

1
@ whuber 덕분에, 나는 그것을 완전히 놓쳤다. 그래서 나는 완전히 잘못된 끝에서 시작했다.
Andy
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.