왜 로지스틱 회귀가 로지스틱 분류라고하지 않습니까?


75

이후 로지스틱 회귀는 통계적되는 분류 모델은 범주 형 종속 변수로 취급, 왜 호출되지 않습니다 물류 분류 ? 연속 회귀 변수를 다루는 모델에 "회귀"이름을 예약해서는 안됩니까?


5
로지스틱 회귀 분석은 GLM 모델 군에 속합니다.
Stéphane Laurent

10
이를 사용하여 확률을 되돌릴 수 있습니다.
Emre

25
로지스틱 회귀는 반환 확률에 대한 임계 값을 도입하여 분류에 확실히 사용될 수 있지만, 그 용도는 거의 사용되지 않거나 심지어는 기본 용도로는 사용되지 않습니다. 분류와 관련이없는 회귀 목적으로 개발되었으며 계속 사용됩니다. 나는 이것이 여전히 주로 주로 사용되는 것이라고 주장하지만, 그것이 당신이 보는 것에 달려 있다고 생각합니다.
Glen_b

6
당신은 찾을 수 이 논문을 그것이 회귀 기법으로 사용되는 문제의 종류의 어떤 의미를 준다 특히 때문에, 흥미 로지스틱 회귀의 개발에.
Glen_b

답변:


102

로지스틱 회귀는 그 자체로는 분류 알고리즘이 아닙니다 . 결과의 예측 확률을 이분법으로 만드는 결정 규칙 과 결합 된 분류 알고리즘 일뿐 입니다. 로지스틱 회귀 분석 피쳐의 다중 선 함수로 클래스 멤버쉽의 확률을 추정하기 때문에 회귀 모델입니다.

Frank Harrell 은이 웹 사이트에 로지스틱 회귀 분석에 대한 함정을 분류 알고리즘으로 열거 한 많은 답변을 게시했습니다. 그들 중 :

내가 올바르게 기억한다면, 그는 한 번 더 이러한 점들에 대해 더 자세히 설명하기 위해 회귀 전략에 관한 그의 책을 지적했지만, 그 특정 게시물을 찾을 수없는 것 같습니다.


1
이 경우 모든 분류 자 ​​(또는 대부분)는 확률이 클래스에 속하는 것으로 예상 한 다음 (내가 아는 한)이 프로브를 클래스로 변환합니다. 그렇지 않습니까?
Outlier

9
@Outlier Counterexample : SVM은 클래스 확률을 전혀 계산하지 않으며 관측치와 초평면 사이의 거리 만 측정합니다.
Sycorax

ML에서 @Outlier를 확률 적 분류기라고합니다. 나무와 임의의 숲은 그렇지 않습니다. xgboost는 최소한 logloss입니다)
seanv507

12

추상적으로 회귀는 조건부 기대 값 를 계산하는 문제입니다 . 이 기대에 의해 취해지는 형태는 데이터가 어떻게 생성되었는지에 대한 가정에 따라 다릅니다.E[Y|X=x]

  • 정규 분포를 따르는 정규 분포 (Y | X = x)는 고전 선형 회귀 분석으로 산출됩니다.
  • 포아송 분포를 가정하면 포아송 회귀가 생성됩니다.
  • Bernoulli 분포를 가정하면 로지스틱 회귀가 생성됩니다.

"회귀"라는 용어는 (Q 의 주어진 Quantile을 추정하는 Quantile Regression과 같은 접근법을 포함하여 이보다 더 일반적으로 사용되었습니다 .(Y|X=x)


-3

이미 제공된 좋은 대답 외에도 Logistic Regression 은 0에서 1 사이의 범위에 있는 확률 ( 연속적인 값 )을 예측 합니다.

여기에 이미지 설명을 입력하십시오

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.