힌지 손실 대 물류 손실의 장단점

14

힌지 손실을 이용하여 정의 될 수있는 및 로그 손실로 정의 될 수 $\text{max}(0, 1-y_i\mathbf{w}^T\mathbf{x}_i)$ $\text{log}(1 + \exp(-y_i\mathbf{w}^T\mathbf{x}_i))$

다음과 같은 질문이 있습니다.

힌지 손실의 단점이 있습니까 (예 : http://www.unc.edu/~yfliu/papers/rsvm.pdf에 언급 된 특이 치에 민감 함 )?
하나와 다른 것의 차이점, 장점, 단점은 무엇입니까?

— 사용자
소스

22

대수 손실 최소화는 잘 동작하는 확률 적 결과물로 이어집니다.

힌지 손실은 이중에서 일부 보장되지는 않지만 희소성을 유발하지만 확률 추정에는 도움이되지 않습니다. 대신, 그것은 오 분류를 처벌합니다 (따라서 마진을 결정하는 것이 매우 유용합니다) : 힌지 손실을 줄이면 마진 오 분류가 감소합니다.

따라서 요약하면 다음과 같습니다.

대수 손실은 정확도 비용으로 더 나은 확률 추정으로 이어집니다
힌지 손실은 확률과 관련하여 훨씬 적은 감도로 인해 정확도가 향상되고 희소성이 향상됩니다.

— 개똥 벌레
소스

1

+1. 로지스틱 손실을 최소화하는 것은 이항 우도를 최대화하는 것과 같습니다. 제곱 오차 손실을 최소화하는 것은 가우시안 가능성을 최대화하는 것에 해당합니다 (OLS 회귀 일 뿐이며 2 클래스 분류의 경우 실제로 LDA와 동일 함). 힌지 손실을 최소화하는 것이 다른 가능성을 최대화하는 것과 일치하는지 알고 있습니까? 즉, 힌지 손실에 해당하는 확률 모델이 있습니까?

— 아메바는 모니카의 복원을 말한다

1

@amoeba 흥미로운 질문이지만 SVM은 기본적으로 통계 모델링을 기반으로하지 않습니다. 그 말을하면서 Glen_b의 답변 을 확인하십시오 . 전체 스레드는 그 주위에 있지만 대신 엡실론에 둔감 한 힌지입니다.

— 파이어 버그

4

@Firebug는 좋은 대답을 얻었습니다 (+1). 사실, 나는 비슷한 질문을했습니다.

분류에서 다른 손실 함수를 선택하면 대략 0-1 손실에 미치는 영향은 무엇입니까?

로지스틱 손실의 또 다른 큰 장점 인 확률 론적 해석에 더 추가하고 싶습니다. 예를 들어 여기 에서 찾을 수 있습니다

특히 로지스틱 회귀는 통계 문헌에서 고전적인 모델입니다. (참조는 어떤 이름 평균 "로지스틱 회귀는?"수행 명명을 위해.) 같은 이항에 최대화 로그 우도 추정, 우도 비 테스트뿐만 아니라, 가정 등의 물류 손실에 관련된 많은 중요한 개념이있다. 다음은 관련 토론입니다.

R의 우도 비 검정

왜 로지스틱 회귀가 로지스틱 분류라고하지 않습니까?

로지스틱 회귀 분석에 대한 iid 가정이 있습니까?

로짓과 프로 빗 모델의 차이점

— 하이 타오 뒤
소스

1

@ hxd1011은 교차 엔트로피의 이점을 추가했기 때문에 하나의 단점을 추가 할 것입니다.

교차 엔트로피 오차는 확률 분포 사이의 많은 거리 측정 중 하나이지만, 그 중 하나의 단점은 긴 꼬리를 갖는 분포가 거의 일어날 수없는 사건에 대해 너무 많은 가중치로 잘못 모델링 될 수 있다는 것입니다.

— 아이린
소스