'링크 기능'과 '정식 링크 기능'이라는 용어의 차이점은 무엇입니까? 또한, 하나를 다른 것보다 사용하는 (이론적) 장점이 있습니까?
예를 들어, 이진 응답 변수는 logit , probit 등과 같은 많은 링크 함수를 사용하여 모델링 할 수 있습니다 . 그러나 여기서 logit 은 "정식"링크 함수로 간주됩니다.
'링크 기능'과 '정식 링크 기능'이라는 용어의 차이점은 무엇입니까? 또한, 하나를 다른 것보다 사용하는 (이론적) 장점이 있습니까?
예를 들어, 이진 응답 변수는 logit , probit 등과 같은 많은 링크 함수를 사용하여 모델링 할 수 있습니다 . 그러나 여기서 logit 은 "정식"링크 함수로 간주됩니다.
답변:
위의 답변은보다 직관적이므로 더 엄격하게 시도합니다.
GLM이란 무엇입니까?
하자 의 응답 세트 나타내는 Y 와 P 차원 공변량 벡터 X = ( X 1 , ... , X의 P ) 기대치와 E ( Y ) = μ를 . 들면 I = 1 , ... , N 독립된 관측 각의 분포 의 Y 나 밀도와 지수 가족 F ( Y I ; 여기서, 관심있는 매개 변수 (자연 또는 표준 매개 변수)는 θ i 이고 ϕ 는 a 스케일 매개 변수 (불필요하거나 불쾌 함)와 γ 및 τ 는 알려진 기능입니다. p에 대한 고정 입력 값의 n 차원 벡터
함수 를 링크 함수라고합니다. 함수가 연결되면 μ , η 및 θ 되도록 η ≡ θ ,이 링크가 정규라고하고 폼 갖는다 g =를 ( γ ' ) - 1 .
그게 다야. 그런 다음 표준 링크를 사용하는 경우 바람직한 통계적 특성이 많이 있습니다. 예를 들어, 충분한 통계량은 j = 1 , … , p 에 대한 성분 ∑ i x i j y i에 대한 이며 , 찾기위한 Newton Method 및 Fisher 점수입니다. ML 추정기가 일치하면 이러한 링크는 MLE의 유도를 단순화하고 선형 회귀의 일부 속성 (예 : 잔차의 합이 0 임)을 유지하거나 μ 가 결과 변수 범위 내에 유지 되도록 합니다.
따라서 기본적으로 사용되는 경향이 있습니다. 그러나 모델의 효과가이 링크 나 다른 링크에 의해 주어진 규모로 추가되어야하는 사전 이유는 없습니다.
gung은 좋은 설명을 인용했다. 정식 연결은 최소한의 충분성에 대한 특별한 이론적 특성을 가지고있다. 즉, 결과 수를 조정하여 조건부 로짓 모델 (이코노미스트가 고정 효과 모델이라고 함)을 정의 할 수 있지만 프로 빗 링크와 함께 사용할 통계가 충분하지 않기 때문에 조건부 프로 빗 모델을 정의 할 수 없습니다.
다음은 MIT의 18.650 클래스 에서 영감을 얻은 작은 다이어그램 으로,이 기능 간의 관계를 시각화하는 데 도움이됩니다. @momo의 게시물과 같은 표기법을 사용했습니다.
다이어그램을 사용하면 한 방향에서 다른 방향으로 쉽게 이동할 수 있습니다.