비선형 대 일반 선형 모형 : 로지스틱, 포아송 등 회귀를 어떻게 참조합니까?


23

동료 통계학 자의 의견을 듣고 싶은 의미론에 대한 질문이 있습니다.

우리는 로지스틱, 포아송 등과 같은 모델이 일반화 된 선형 모델의 우산에 속한다는 것을 알고 있습니다. 모델에는 매개 변수의 비선형 함수가 포함되어 있으며, 적절한 링크 함수를 사용하여 선형 모델 프레임 워크를 사용하여 모델링 할 수 있습니다.

로지스틱 회귀와 같은 상황을 다음과 같이 고려할지 궁금합니다.

  1. 매개 변수의 형태를 고려한 비선형 모델
  2. 링크는 우리를 선형 모델 프레임 워크로 변환하기 때문에 선형 모델
  3. 동시에 (1) 및 (2) : 비선형 모델로 "시작"되지만 선형 모델로 생각할 수있는 방식으로 작업 할 수 있습니다.

실제 설문 조사를 설정할 수 있으면 좋겠다 ...

답변:


24

이것은 좋은 질문입니다.

우리는 로지스틱, 포아송 등과 같은 모델이 일반화 된 선형 모델의 우산에 속한다는 것을 알고 있습니다.

예, 아니오 질문의 맥락에서, 우리는 우리가 이야기하고있는 것을 구체적으로주의해야합니다. "로지스틱"과 "포아송"만으로는 의도 된 것을 설명하기에 충분하지 않습니다.

(i) "포아송"은 분포입니다. 조건부 분포에 대한 설명으로서 조건부 평균을 설명하기 위해 선형 (모수) 모델을 지정하지 않으면 (즉, "포아송"이라고 말하는 것만으로는 충분하지 않음) 선형이 아니므로 GLM이 아닙니다. 사람들이 "포아송 회귀"를 지정하면, 그들은 거의 항상 모델에 의도 입니다 매개 변수 선형, 따라서 GLM입니다. 그러나 "포아송"만으로도 여러 가지가 될 수 있습니다 *.

(ii) 반면 "물류"는 평균에 대한 설명 (평균이 예측 변수에 물류 임)을 나타냅니다. 지수 계열에있는 조건부 분포와 결합하지 않으면 GLM이 아닙니다. 사람들 이 다른 한편으로 " 로지스틱 회귀 " 라고 말할 때 , 그들은 거의 항상 로짓 링크가 있는 이항 모델 을 의미합니다. 즉, 예측 변수에 로지스틱이 있다는 것은 모델이 모수에서 선형이며 지수 계열에 속하므로 GLM도 마찬가지입니다.

이 모델에는 매개 변수의 비선형 함수가 포함됩니다.

다시, 예, 아니오.

선형 "일반화 선형 모델"에서이 매개 변수가 선형 모델을 입력했다. 특히, 선형 예측 변수 의 스케일 에서 모델은 입니다.η=g(μ)η=Xβ

이는 적절한 링크 함수를 사용하여 선형 모델 프레임 워크를 사용하여 모델링 될 수 있습니다.

옳은

로지스틱 회귀와 같은 상황을 다음과 같이 고려할지 궁금합니다.

(여기서 질문 순서를 변경하고 있습니다)

링크는 우리를 선형 모델 프레임 워크로 변환하기 때문에 선형 모델

정확히 이런 이유로 GLM을 "선형"이라고 부르는 것이 일반적입니다. 실제로 이것이 이름에 있기 때문에 이것이 규칙이라는 것이 분명합니다 .

매개 변수의 형태를 고려한 비선형 모델

"nonlinear"는 일반적으로 매개 변수가 비선형 인 모델을 나타내므로 여기에서 매우주의해야합니다. 일반화 된 선형 모형과 비선형 회귀를 대조합니다.

따라서 GLM을 설명하기 위해 "nonlinear"라는 용어를 사용하려면 의미가 무엇인지 신중하게 지정해야합니다. 일반적으로 평균은 예측 변수와 선형 적으로 관련이 없습니다.

실제로 "nonlinear"를 사용하여 GLM을 참조하면 컨벤션 (오해 될 수 있음)뿐만 아니라 일반화 된 비선형 모델 에 대해 이야기 할 때 어려움을 겪게 됩니다 . 이미 GLM을 "비선형 모델"로 특성화 한 경우 구별을 설명하기가 약간 어렵습니다!

* Poisson 비선형 회귀 모델을 고려하십시오. 모수가 선형으로 입력되는 가없는 모델 은 다음과 같습니다.g(μ)

YPoisson(μx)

예를 들어, 가 나이 인 경우, 주어진 는 사망으로 관찰되며 는 세의 인구 연간 사망률에 대한 모델입니다 .xYxμxx

μx=α+exp(βx).

(일반적으로 우리는 여기서 항을 이동시킬 세 인구에 대해 오프셋을 가지지 만 일정한 노출을 관찰하는 상황을 정할 수 있습니다. 포아송 모델과 이항 모형은 모두 사망률을 모델링하는 데 사용됩니다.)xα

여기서 첫 번째 용어는 사고로 인한 지속적인 사망률 (예 : 연령과 관련이없는 다른 영향)을 나타내며, 두 번째 용어는 연령으로 인해 사망률이 증가합니다. 이러한 모델은 아마도 후기 성인-하지만 노화되지 않은 연령의 범위에서 때로는 가능할 수도 있습니다. 그것은 본질적으로 Makeham의 법칙입니다 (위험 함수로 표시되지만, 연간 요금이 합리적인 근사치입니다).

일반화 된 비선형 모델입니다.


입력 해 주셔서 감사합니다. 이것이 내가 얻으려고하는 것입니다. 분명히 "선형"은 GLM의 이름입니다. 나는 (그들이 본질적으로 비선형 그 모델을 분류하기 위해 노력하고 있습니다 매개 변수의 비선형), 아직 "transformably 선형,"따라서 GLM 프레임 워크에 해당. 아마 내 질문에 답한 것 같아요. 그것들을 참조하는 가장 좋은 방법은 "변형 가능 비선형"입니다.
Meg

1
변환에 의해 매개 변수에서 선형으로 렌더링 될 수있는 모델을 참조하는 가장 일반적인 방법은 "선형화 가능"( "강제적으로 비선형"과 대조)입니다. 모델을 논의 할 때 그것이 선형인지 (비선형인지) 명확해야하며, 사람들이 정보를 찾고 이해할 수 있어야하므로 이러한 것들이 일반적으로 어떻게 참조되는지 명확해야한다고 생각합니다. 토론 할 때 GLM을 "비선형 적"이라고 말하는 사람은 자신의 의미를 명확하게하는 올바른 한정자를 추가하지 않으면 잘못 이해 될 수 있습니다.
Glen_b-복지 주 모니카

동의한다. 나는 그것이 텍스트에서 비선형 회귀로 분류 된 것을 보았고 교수들도 비선형이라고 가르쳤습니다. 우리가 GLM 프레임 워크에서 다루었 기 때문에 개인적으로 혼란스러워하지만, 적어도 그것을 부르는 것에 공감할 수는 있습니다. 선형화 가능 / 변형 가능 선형과 A 지점에서 B 지점으로 이동하는 방법 (즉, 비선형 함수로 시작하여 선형 프레임 워크로 변환하는 방법)에 대해 논의하고 있다고 생각합니다.
Meg

예, 전적으로 이해합니다. 나는 또한 그들의 충동에 공감을 표하고 있지만, 귀를 가지고 있다면 위에서 설명한 이유로 비선형 모델 (적어도 용어를 항상 한정하지는 않지만)이라고 부르는 관행에 대해주의를 기울일 것입니다. 그것이 왜 이것이 중요한 질문이라고 생각하는지의 큰 부분입니다. 사람들은 때때로 비선형이라고 부릅니다. 우리가 비선형이라고 부르는 것에 대해 분명한 한 가장 좋은 방법은 아닙니다. 우리가 협약을 무시할 때는 신중하고 신중하게 행동해야합니다.
Glen_b-복지 주 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.