이항 회귀와 로지스틱 회귀의 차이점은 무엇입니까?


20

나는 항상 로지스틱 회귀를 링크 함수가 로지스틱 함수 (프로 빗 함수 대신) 인 이항 회귀의 특별한 경우라고 생각했습니다.

그래도 내가 가진 또 다른 질문에 대한 답을 읽음으로써 혼란 스러울 것 같고 로지스틱 회귀와 로지스틱 링크가있는 이항 회귀에는 차이가 있습니다.

차이점이 뭐야?

답변:


13

로지스틱 회귀는 "로지스틱"링크 기능이있는 이항 회귀입니다.

g(p)=log(p1p)=Xβ

로지스틱 회귀 분석은 일반적으로 이항 계수가 아닌 이항 비율에 적용된다고 생각합니다.


1
로지스틱 회귀가 일반적으로 개수가 아닌 비율에 적용된다는 것은 무엇을 의미합니까? 사람들이 파티에 참석할 것인지 아닌지를 예측하려고한다고 가정하고 특정 파티에 대해 9 명이 참석했지만 1 명이 참석하지 않았다는 것을 알고 있습니다. 로지스틱 회귀 분석이이를 하나의 훈련 예 (예 : 이 당사자는 0.9의 성공률을 보인 반면, 링크를 사용한 이항 회귀는 이것을 10 가지 훈련 사례 (9 개의 성공, 1 개의 실패)로 간주합니까?
raegtin

@raehtin-두 경우 모두 ( n i , f i ) = ( 10 , 0.9 )( n i , x i ) = ( 10 , 9 ) 인 샘플 / 훈련 사례 입니다. 차이는 평균 및 분산 함수의 형태입니다. 이항의 경우 평균은 μ i = n i p i 이며, 정식 링크는 이제 로그입니다 ( μ i1(ni,fi)=(10,0.9)(ni,xi)=(10,9)μi=nipi( "자연 모수"라고도 함) 분산 함수는V(μi)=μi(niμi)입니다.log(μiniμi)분산 파라미터가ϕi=1 인 n i . 로지스틱의 경우 평균μi=pi, 위 링크, 분산 함수V(μi)=μi(1μi)및 분산은ϕi=1과 같습니다.V(μi)=μi(niμi)niϕi=1μi=piV(μi)=μi(1μi) . ϕi=1ni
chanceislogic

물류에 의해, 평균 및 분산 기능으로부터 분리되고, 그래서 더 쉽게로 고려 될 수있다 가중ni
probabilityislogic

아, 그것을 가지고, 나는 생각 나는 참조하십시오. 이것은 그들이 동등한 결과를 산출한다는 것을 의미합니까 (단순히 다른 방식으로 도착 했습니까)?
raegtin

1
@raegtin-그렇게 생각합니다. GLM 가중치, 는 두 경우 모두 동일하며, 링크 함수는 동일한 로짓 값을 생성합니다. 따라서 X 변수도 동일하면 동일한 결과를 제공해야합니다. wi2=1ϕiV(μi)[g(μi)]2
chanceislogic

4

이항 회귀 분산이 주어진다 이항 평균 분산 관계하여 GLM 임의 유형 . 로지스틱 회귀에 Y = 로짓 - 1 ( X β ) = 1 / ( 1 - EXP ( X β ) )var(Y)=Y^(1Y^)Y^=logit1(Xβ^)=1/(1exp(Xβ^))로짓 기능을 "링크"기능이라고합니다. 그러나 이항 회귀 모형의 일반 클래스는 이외의 범위를 출력하는 함수까지 모든 유형의 링크 함수로 정의 할 수 있습니다 . 예를 들어, 프로 빗 회귀 분석은 역 정규 CDF의 링크를 취하고, 상대 위험 회귀 분석은 로그 기능의 링크를 취하며, 추가 위험 모델은 ID 링크 모델을 사용합니다.[0,1]

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.