변수가 변환 된 LM과 GLM이 다른 이유


16

이 과정 유인물 (1 페이지)에 설명 된대로 선형 모델은 다음 형식으로 작성 될 수 있습니다.

y=β1x1++βpxp+εi,

여기서 y 는 반응 변수이고 xiith 설명 변수.

테스트 가정을 충족시키기 위해 종종 응답 변수를 변환 할 수 있습니다. 예를 들어 각 yi 에 로그 함수를 적용합니다 . 응답 변수를 변환하는 것은 GLM을 수행하는 것과 동일하지 않습니다.

GLM은 다음과 같은 형식으로 작성 될 수 있습니다 ( 코스 유인물에서 다시 (페이지 3) )

g(u)=β1x1++βpxp+εi,

여기서 u 대한 또 다른 상징 인 y 나는 코스 유인물에 2 페이지에서 이해. g() 를 링크 기능이라고합니다.

코스의 슬라이드에서 변형 된 변수가있는 GLM과 LM의 차이점을 실제로 이해하지 못합니다. 저 좀 도와 주실 래요?


2
이항 결과의 모든 변환이 적절하다는 사실을 고려 하는 것이 좋을 것이므로 결과적으로 평소 최소 제곱 회귀로 제한됩니다. 이것은 로지스틱 회귀 (이항 반응의 표준 GLM)가 달성 한 것이 아닙니다. (증거 : 결과 값을 y 1 로 인코딩 하고 ϕ 를 임의의 변환으로 하자 . z 0 = ϕ ( y 0 )z 1 = ϕ ( y 1 ) 를 작성하면 ϕ{ yy0y1ϕz0=ϕ(y0)z1=ϕ(y1)ϕ Y λ Y + μ (의 아핀 변환 인 Y ) λ = ( Z 1 - (Z) 0 ) / ( Y (1) - Y 0 ) μ = Z 0 - λ Y 0 .){y0,y1}yλy+μyλ=(z1z0)/(y1y0)μ=z0λy0
whuber

답변:


15

선형 회귀를 수행하기 전에 응답을 변환하면 다음과 같습니다.

E(g(Y))β0+β1x1++βpxp

여기서 는 주어진 함수이며 g ( Y ) 라고 가정합니다.gg(Y) 는 주어진 분포를 가지고 (보통 보통).

일반화 된 선형 모델은 다음을 수행합니다.

g(E(Y))β0+β1x1++βpxp

여기서 는 이전과 같으며 Y 는 주어진 분포를 가지고 있다고 가정합니다 (보통 정상이 아님).gY


방정식에서 E는 무엇입니까?
user1406647

1
의 기대 값의 표준 표기법 X . E(X)X
Marcus PS

또한이 정보가 도움이되었다 : christoph-scherber.de/content/PDF%20Files/…
Aditya

22

이것이 이것이 당신에게 완전한 답이 될지 확신 할 수 없지만, 개념적 logjam을 없애는 데 도움이 될 수 있습니다.

계정에 다음과 같은 두 가지 오해가있는 것 같습니다.

  1. 평범한 최소 제곱 (OLS- 'linear') 회귀 일반화 된 선형 모형의 특수한 경우입니다. 따라서 "응답 변수의 범위를 지정해도 GLM 수행과 동일하지 않다"고 말하면 이는 잘못된 것입니다. 선형 모델 피팅 또는 응답 변수 변환 및 선형 모델 피팅은 모두 'GLM 수행'을 구성합니다.

  2. GLM의 표준 공식에서, " "(종종 μ 로 표시되지만 선호하는 문제임)는 공변량 공간의 특정 위치 (예 : X) 에서 조건부 반응 분포의 평균입니다. ). 따라서 "여기서 uy에 대한 또 다른 기호 "라고 말하면 이는 잘못된 것입니다. OLS 제형에서, Y 는 랜덤 변수이고 및 / 또는 y i 는 관측 / 연구 단위 i에 대한 Y 의 실현 된 값이다 . 즉, y (보다 일반적으로)는 매개 변수가 아닌 data를 나타냅니다 . uμXuyYyiYiy

    (나는 실수를 겪고 있다는 의미는 아니며, 이것이 혼란을 일으킬 수 있다고 생각합니다.)

  3. 언급하지 않은 일반 선형 모델의 또 다른 측면이 있습니다. 즉, 우리는 응답 분포를 지정합니다. OLS 회귀의 경우 응답 분포는 가우시안 (정상)이고 링크 함수는 항등 함수입니다. 예를 들어 로지스틱 회귀의 경우 (GLM에 대해 사람들이 처음 생각할 때 생각할 수 있음) 응답 분포는 베르누이 (/ 이항)이고 링크 함수는 로짓입니다. OLS에 대한 가정이 충족되도록 변환을 사용할 때 우리는 종종 조건부 응답 분포를 수용 가능하게 만들기 위해 노력하고 있습니다. 그러나 그러한 변형으로 인해 Bernoulli 분포가 정상적으로 정상화되지는 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.