GLM의 "링크 기능"과 "정식 링크 기능"의 차이점은 무엇입니까?


65

'링크 기능'과 '정식 링크 기능'이라는 용어의 차이점은 무엇입니까? 또한, 하나를 다른 것보다 사용하는 (이론적) 장점이 있습니까?

예를 들어, 이진 응답 변수는 logit , probit 등과 같은 많은 링크 함수를 사용하여 모델링 할 수 있습니다 . 그러나 여기서 logit 은 "정식"링크 함수로 간주됩니다.


10
이진 반응 변수의 회귀에 중점을 둔 로짓과 프로 빗 모델의 차이점에 대해 링크 기능에 대해 광범위하게 논의 합니다. 이 논의 중 일부만이 링크 함수가 '정식'이라는 의미에 중점을 두지 만 그럼에도 불구하고 읽는 것이 도움이 될 수 있습니다. 정식 링크와 비 정식 링크 함수의 구별 b / t 및 장점을 이해하려면 GLiM의 기초가되는 수학에 상당히 깊이 들어가야합니다.
gung-Monica Monica 복원

답변:


68

위의 답변은보다 직관적이므로 더 엄격하게 시도합니다.

GLM이란 무엇입니까?

하자 의 응답 세트 나타내는 YP 차원 공변량 벡터 X = ( X 1 , ... , X의 P ) 기대치와 E ( Y ) = μ를 . 들면 I = 1 , ... , N 독립된 관측 각의 분포 의 Y 밀도와 지수 가족 F ( Y I ;와이=(와이,엑스)와이엑스=(엑스1,,엑스)이자형(와이)=μ나는=1,,와이나는 여기서, 관심있는 매개 변수 (자연 또는 표준 매개 변수)는 θ i 이고 ϕ 는 a 스케일 매개 변수 (불필요하거나 불쾌 함)와 γ τ 는 알려진 기능입니다. p에 대한 고정 입력 값의 n 차원 벡터

에프(와이나는;θ나는,ϕ)=특급{[와이나는θ나는γ(θ나는)]/ϕ+τ(와이나는,ϕ)}
θ나는ϕγτ설명 변수는 로 표시됩니다 . 우리는 입력 만 선형 함수, 선형 예측을 통해 영향 (1) 벡터 가정 η I = β 0 + β 1 X I 1 + + β (P)의 X의 난의 P 되는 때 θ 내가 의존한다. 그것은이 도시 될 수있는 바와 같이 θ =를 ( γ ' ) - 1 ( μ )엑스1,,엑스
η나는=β0+β1엑스나는1++β엑스나는
θ나는θ=(γ')1(μ)이 종속성은 평균을 통해 선형 예측 변수 θ 를 연결하여 설정됩니다 . 보다 구체적으로, 평균 μ 는 선형 예측 변수의 가역적이고 부드러운 함수로 나타납니다. 즉 g ( μ ) = η 또는 μ = g - 1 ( η ) 이제 질문에 답하십시오.ηθμ
(μ)=η 또는 μ=1(η)

함수 를 링크 함수라고합니다. 함수가 연결되면 μ , ηθ 되도록 η θ ,이 링크가 정규라고하고 폼 갖는다 g =를 ( γ ' ) - 1 .()μηθηθ=(γ')1

그게 다야. 그런 다음 표준 링크를 사용하는 경우 바람직한 통계적 특성이 많이 있습니다. 예를 들어, 충분한 통계량은 j = 1 , , p 에 대한 성분 i x i j y i에 대한 이며 , 찾기위한 Newton Method 및 Fisher 점수입니다. ML 추정기가 일치하면 이러한 링크는 MLE의 유도를 단순화하고 선형 회귀의 일부 속성 (예 : 잔차의 합이 0 임)을 유지하거나 μ 가 결과 변수 범위 내에 유지 되도록 합니다.엑스'와이나는엑스나는제이와이나는제이=1,,μ

따라서 기본적으로 사용되는 경향이 있습니다. 그러나 모델의 효과가이 링크 나 다른 링크에 의해 주어진 규모로 추가되어야하는 사전 이유는 없습니다.


5
+1, 이것은 정말 좋은 답변입니다, @Momo. 문단에 묻었을 때 일부 방정식을 읽기가 더 어려워서 이중 달러 기호 (예 : $ $) 를 사용하여 '차단'했습니다 . 나는 그것이 좋기를 바랍니다 (그렇지 않으면 내 사과와 함께 롤백 할 수 있음).
gung-Monica Monica 복원

1
그러나 @Momo의 원래 질문에는 Wei가 요청한 내용이 포함되어 있으므로 아직 명확하게 대답하지 않은 것이 좋습니다.
Glen_b

1
θη=θ(μ)=θθ=(γ')1(μ)θθμ(.)=(γ')1(.)

1
γ(θ)=π=exp(θ)1+exp(θ)(γ)1(.)=logit(.)η=θg(.)θ=logit(π)=ηθη표준 링크 기능을 사용하는 경우에만 존재합니다.
Druss2k

2
μθηθ

16

gung은 좋은 설명을 인용했다. 정식 연결은 최소한의 충분성에 대한 특별한 이론적 특성을 가지고있다. 즉, 결과 수를 조정하여 조건부 로짓 모델 (이코노미스트가 고정 효과 모델이라고 함)을 정의 할 수 있지만 프로 빗 링크와 함께 사용할 통계가 충분하지 않기 때문에 조건부 프로 빗 모델을 정의 할 수 없습니다.


최소한의 충분성에 대해 조금 자세히 설명해 주시겠습니까? 위의 설명으로 우리는 여전히 프로 빗 모델을 정의 할 수 있습니다. 정식 링크 기능은 아니지만 비정규 링크 기능을 사용하면 해가됩니다.
pikachuchameleon

9

다음은 MIT의 18.650 클래스 에서 영감을 얻은 작은 다이어그램 으로,이 기능 간의 관계를 시각화하는 데 도움이됩니다. @momo의 게시물과 같은 표기법을 사용했습니다.

여기에 이미지 설명을 입력하십시오

  • γ(θ)
  • g(μ)

다이어그램을 사용하면 한 방향에서 다른 방향으로 쉽게 이동할 수 있습니다.

η=(γ(θ))
θ=γ'1(1(η))

정식 링크 기능

γ11=(γ')1=나는
θ=η

1

위의 답변은 이미 말하고 싶은 것을 다루었습니다. 머신 러닝 연구원으로서 몇 가지 요점을 명확히하기 위해 :

  1. 링크 기능은 활성화 기능의 역수에 지나지 않습니다. 예를 들어,로 짓은 시그 모이 드의 역수이고, 프로 빗은 가우시안의 누적 분포 함수의 역수입니다.

  2. 엑스엑스

위의 논의는 지수 가족과는 아무런 관련이 없지만 Christopher Bishop의 PRML 서적 4.3.6 장에서 좋은 토론을 찾을 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.