손실 함수와 의사 결정 함수의 차이점은 무엇입니까?


23

두 함수 모두 Gradient Boosting Regressors 와 같은 데이터 마이닝 방법의 일부라는 것을 알았습니다. 나는 그것들도 별도의 객체라는 것을 알았습니다.

둘 사이의 일반적인 관계는 어떻습니까?

답변:


45

결정 함수가 입력으로서 데이터 집합을 취하여 출력으로서 결정을 제공하는 기능이다. 결정이 될 수있는 것은 당면한 문제에 달려 있습니다. 예를 들면 다음과 같습니다.

  • 추정 문제 : "결정"은 추정치입니다.
  • 가설 검정 문제 : 귀무 가설 을 기각하거나 기각하지 않기로 결정합니다.
  • 분류 문제 : 결정은 새로운 관찰 (또는 관찰)을 범주로 분류하는 것입니다.
  • 모델 선택 문제 : 결정은 후보 모델 중 하나를 선택하는 것입니다.

일반적으로, 문제점에 대해 사용 가능한 무한한 의사 결정 기능이 있습니다. 예를 들어 10 개의 관측 값 기반으로 스웨덴 남성의 신장을 추정하는 데 관심이 있다면 다음 의사 결정 함수 :d ( x )x=(x1,x2,,x10)d(x)

  • 샘플 평균은 입니다.(엑스)=110나는=110엑스나는
  • 샘플의 중앙값 :(엑스)=중앙값(엑스)
  • 표본의 기하 평균 :(엑스)=엑스1엑스1010
  • 함수는 항상 1 반환 : 상관없이 값의 . 어리석은 일이지만, 그럼에도 불구하고 유효한 의사 결정 기능입니다.(X)를(엑스)=1엑스

그러면 어떤 결정 기능을 사용할 것인지 어떻게 결정할 수 있습니까? 한 가지 방법은 가능한 모든 결정과 관련된 손실 (또는 비용)을 설명 하는 손실 기능 을 사용하는 것 입니다. 다른 의사 결정 기능은 다른 유형의 실수로 이어질 수 있습니다. 손실 기능은 우리가 더 염려해야 할 실수 유형을 알려줍니다. 최선의 결정 함수는 가장 낮은 예상 손실 을 산출하는 함수입니다 . 예상 손실이 의미하는 것은 설정에 따라 다릅니다 (특히, 빈번주의 또는 베이지안 통계 에 대해 이야기하고 있는지 여부 ).

요약해서 말하자면:

  • 의사 결정 기능은 데이터를 기반으로 결정을 내리는 데 사용됩니다.
  • 손실 기능은 사용할 의사 결정 기능을 결정하는 데 사용됩니다.

모수 결정 기능 (예 : 로지스틱 회귀, 임계 값 결정)의 경우 기본적으로 각 매개 변수 조합에 대해 하나의 가능한 기능이 있으며 손실 기능은 가장 좋은 기능을 찾는 데 사용됩니다. 일반적인 예 : 그래디언트 디센트를 사용하여 파라미터 공간을 탐색하는 경우 파라미터와 관련하여 손실을 도출하고 손실의 (로컬) 최소값으로 내려갑니다.
pixelou 2016 년

7

손실 함수는 어떤 의미에서 최적 인 모델을 얻기 위해 최소화되는 것입니다. 모델 자체에는 예측에 사용되는 결정 기능이 있습니다.

예를 들어 SVM 분류기에서 :

  • 손실 함수 : 분리 초평면 오차와 제곱 규범을 최소화(,ξ)=122+기음나는ξ나는
  • 결정 함수 : 분리 초평면까지의 서명 된 거리 :에프(엑스)=엑스+

표준이 거리와 같지 않습니까, 아니면 여기에 무언가를 섞어 놓습니까? 그래서 결정 함수는 항상 모델을 수정하려고하는 실제 값과 "비교"하는 데 사용하는 손실 함수의 일부입니까? 목표는이 "차이"를 최소화하는 것입니까?
Hiatus

@Hiatus 분리 하이퍼 플레인의 표준 (SVM 훈련시 최적화 됨)은 결정 기능에 사용되지 않습니다. 초평면 자체가 사용됩니다. 훈련 중 규범을 최소화하는 것은 기본적으로 정규화의 한 형태입니다.
Marc Claesen

특정 분류 기준과 관련이없는보다 일반적인 답변을 제공하는 것이 좋습니다.
smci
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.