0-1 손실 기능 설명


19

손실 함수의 목적이 무엇인지 파악하려고 노력하고 있으며 이해할 수 없습니다.

따라서 손실 함수를 이해하는 한, 잘못된 결정의 "비용"을 측정 할 수있는 일종의 메트릭을 도입하는 것입니다.

30 개 개체의 데이터 세트를 가지고 있고이를 20/10과 같은 훈련 / 테스트 세트로 나누었다 고 가정하겠습니다. 0-1 손실 함수를 사용할 것이므로 클래스 레이블 세트가 M 이고 함수가 다음과 같다고 가정하겠습니다. :

(나는,제이)={0나는=제이1나는제이나는,제이미디엄

따라서 훈련 데이터를 기반으로 모델을 작성하고 Naive Bayes 분류기를 사용한다고 가정하면이 모델은 7 개의 객체를 올바르게 분류하고 (올바른 클래스 레이블이 지정됨) 3 개의 객체가 잘못 분류되었습니다.

따라서 손실 함수는 "0"을 7 번, "1"을 3 번 반환합니다. 어떤 종류의 정보를 얻을 수 있습니까? 내 모델이 객체의 30 %를 잘못 분류 했습니까? 아니면 더 있습니까?

내 생각에 실수가 있으면 정말 죄송합니다. 배우려고합니다. 내가 제공 한 예가 "너무 추상적"이라면 좀 더 구체적으로 노력하겠습니다. 다른 예제를 사용하여 개념을 설명하려고 시도하면 0-1 손실 기능을 사용하십시오.

답변:


14

0-1 손실 함수를 정확하게보고 정확하게 요약했습니다. 귀하의 1은 잘못 분류 된 항목에 관계없이 잘못 분류 된 항목에 대한 지표가됩니다. 10 개의 항목 중 3 개의 1이 있으므로 분류 정확도는 70 %입니다.

손실 함수의 가중치를 변경하면이 해석은 더 이상 적용되지 않습니다. 예를 들어, 질병 분류에서, 질병을 잘못 진단하는 것 (가양 성)보다 긍정적 인 질병 사례 (가양 성)를 놓치는 것이 더 비용이 많이들 수 있습니다. 이 경우 손실 함수는 잘못된 음성 오 분류에 더 많은 가중치를 부여합니다. 이 경우 손실의 합계는 더 이상 정확도를 나타내지 않고 오 분류의 총 "비용"을 나타냅니다. 0-1 손실 함수는 정확도와 동등합니다. 오류가 발생하는 방식이 아니라 올바른지 여부 만 신경 쓰기 때문입니다.


통계에서 발생률을 정의하는 @JohnnyJohansson은 en.wikipedia.org/wiki/Sensitivity_and_specificity
Tim

@Tim-여전히 0-1 손실 함수로 혼동됩니다. 결과 행렬에 1보다 큰 값이있을 수 있습니다. 즉, 3 개의 미스 분류가있는 경우 해당 항목에 3의 값이 표시됩니까? 여기 참조 math.stackexchange.com/questions/2623072/…
Xavier Bourret Sicotte


0

혼란이 하나의 데이터 포인트에 대한 손실과 전체 데이터 세트에 대한 손실을 구별하지는 않는다고 생각합니다.

(와이,와이^)

나는(와이나는,와이^나는)

실제로 차이가 발생하지만 전체 데이터 세트의 손실을 계산하는 것 이외의 한 데이터 포인트에 대해이 손실이 필요한 것이 무엇인지 이해하기가 어렵습니까? 특정 문제에 대해 적절한 손실 기능을 선택할 때 고려해야 할 사항은 무엇입니까?
Johnny Johansson
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.