이것은 좋은 질문입니다.
우리는 로지스틱, 포아송 등과 같은 모델이 일반화 된 선형 모델의 우산에 속한다는 것을 알고 있습니다.
예, 아니오 질문의 맥락에서, 우리는 우리가 이야기하고있는 것을 구체적으로주의해야합니다. "로지스틱"과 "포아송"만으로는 의도 된 것을 설명하기에 충분하지 않습니다.
(i) "포아송"은 분포입니다. 조건부 분포에 대한 설명으로서 조건부 평균을 설명하기 위해 선형 (모수) 모델을 지정하지 않으면 (즉, "포아송"이라고 말하는 것만으로는 충분하지 않음) 선형이 아니므로 GLM이 아닙니다. 사람들이 "포아송 회귀"를 지정하면, 그들은 거의 항상 모델에 의도 입니다 매개 변수 선형, 따라서 GLM입니다. 그러나 "포아송"만으로도 여러 가지가 될 수 있습니다 *.
(ii) 반면 "물류"는 평균에 대한 설명 (평균이 예측 변수에 물류 임)을 나타냅니다. 지수 계열에있는 조건부 분포와 결합하지 않으면 GLM이 아닙니다. 사람들 이 다른 한편으로 " 로지스틱 회귀 " 라고 말할 때 , 그들은 거의 항상 로짓 링크가 있는 이항 모델 을 의미합니다. 즉, 예측 변수에 로지스틱이 있다는 것은 모델이 모수에서 선형이며 지수 계열에 속하므로 GLM도 마찬가지입니다.
이 모델에는 매개 변수의 비선형 함수가 포함됩니다.
다시, 예, 아니오.
선형 "일반화 선형 모델"에서이 매개 변수가 선형 모델을 입력했다. 특히, 선형 예측 변수 의 스케일 에서 모델은 입니다.η=g(μ)η=Xβ
이는 적절한 링크 함수를 사용하여 선형 모델 프레임 워크를 사용하여 모델링 될 수 있습니다.
옳은
로지스틱 회귀와 같은 상황을 다음과 같이 고려할지 궁금합니다.
(여기서 질문 순서를 변경하고 있습니다)
링크는 우리를 선형 모델 프레임 워크로 변환하기 때문에 선형 모델
정확히 이런 이유로 GLM을 "선형"이라고 부르는 것이 일반적입니다. 실제로 이것이 이름에 있기 때문에 이것이 규칙이라는 것이 분명합니다 .
매개 변수의 형태를 고려한 비선형 모델
"nonlinear"는 일반적으로 매개 변수가 비선형 인 모델을 나타내므로 여기에서 매우주의해야합니다. 일반화 된 선형 모형과 비선형 회귀를 대조합니다.
따라서 GLM을 설명하기 위해 "nonlinear"라는 용어를 사용하려면 의미가 무엇인지 신중하게 지정해야합니다. 일반적으로 평균은 예측 변수와 선형 적으로 관련이 없습니다.
실제로 "nonlinear"를 사용하여 GLM을 참조하면 컨벤션 (오해 될 수 있음)뿐만 아니라 일반화 된 비선형 모델 에 대해 이야기 할 때 어려움을 겪게 됩니다 . 이미 GLM을 "비선형 모델"로 특성화 한 경우 구별을 설명하기가 약간 어렵습니다!
* Poisson 비선형 회귀 모델을 고려하십시오. 모수가 선형으로 입력되는 가없는 모델 은 다음과 같습니다.g(μ)
Y∼Poisson(μx)
예를 들어, 가 나이 인 경우, 주어진 는 사망으로 관찰되며 는 세의 인구 연간 사망률에 대한 모델입니다 .xYxμxx
μx=α+exp(βx).
(일반적으로 우리는 여기서 항을 이동시킬 세 인구에 대해 오프셋을 가지지 만 일정한 노출을 관찰하는 상황을 정할 수 있습니다. 포아송 모델과 이항 모형은 모두 사망률을 모델링하는 데 사용됩니다.)xα
여기서 첫 번째 용어는 사고로 인한 지속적인 사망률 (예 : 연령과 관련이없는 다른 영향)을 나타내며, 두 번째 용어는 연령으로 인해 사망률이 증가합니다. 이러한 모델은 아마도 후기 성인-하지만 노화되지 않은 연령의 범위에서 때로는 가능할 수도 있습니다. 그것은 본질적으로 Makeham의 법칙입니다 (위험 함수로 표시되지만, 연간 요금이 합리적인 근사치입니다).
일반화 된 비선형 모델입니다.