다항 로지스틱 회귀 가정


답변:


6

MNL의 주요 가정은 오류가 Gumbel 극값 분포와 함께 독립적이고 동일하게 분포된다는 것입니다. 의 문제 시험 이 가정은 구성되어 있다는 점이다 선험적 . 표준 회귀 분석에서는 최소 제곱 곡선을 맞추고 잔차 오차를 측정합니다. 로짓 모형에서는 오차가 이미 점을 측정하고 있다고 가정하고 해당 가정으로부터 우도 함수를 계산합니다.

중요한 가정은 샘플이 외인성이라는 것입니다. 선택 기반 인 경우에는 수정이 필요합니다.

모델 자체에 대한 가정에서 Train 은 다음 세 가지를 설명합니다.

  1. 체계적이고 비 임의의 맛 변화.
  2. 대안 중 비례 대체 (IIA 속성의 결과).
  3. 오류 항 (패널 데이터)에 직렬 상관이 없습니다.

첫 번째 가정은 문제의 맥락에서 대부분 방어해야합니다. 세 번째는 오류 조건이 완전히 무작위이기 때문에 거의 동일합니다.

그러나 두 번째는 어느 정도 테스트 할 수 있습니다. 중첩 된 로짓 모델을 지정하고 중첩 간 대체 패턴이 완전히 유연함 ( ) 인 경우 MNL 모델을 사용할 수 있으며 IIA 가정이 유효합니다. 그러나 내포 된 로짓 모델에 대한 로그 우도 함수는 로컬 최대 값을 가지므로 일관되게 유지해야합니다.λ=1λ=1

SPSS 에서이 작업을 수행하는 mlogit한 R 에서 패키지를 대신 사용하도록 제안하는 것 외에는 도움이되지 않습니다 . 죄송합니다.


또한 다항식 프로 빗 모델은 다른 가정 세트와 비교할 수있는 출력을 제공합니다. 따라서 MNP / MNL 비교도 유용 할 수 있습니다.
gregmacfarlane 2012 년

3

다항 로지스틱의 가장 중요한 실제 가정 중 하나는 최소 주파수 범주 의 관측치 수가 예를 들어 모형 오른쪽의 모수 개수의 10 배인 것입니다.와이


이것이 항상 완전하지는 않다는 것이 밝혀졌습니다. 실제 인구 빈도가 무엇인지에 대한 외생 정보가 있다면 관찰하지 않은 대안에 대해 일관된 매개 변수를 추정 할 수 있다는 최근 연구 결과가 있습니다. 그러나 이것은 다른 추정기가 필요하므로 일반적으로 맞습니다.
gregmacfarlane

1
베이지안 이전의 소리가 요구되고 있습니다-동의 할 수 없습니다. 그러나 외부 정보가 없으면 제약이없는 다항 로지스틱은 추정 할 수많은 매개 변수를 갖습니다.
Frank Harrell

2

gmacfarlane은 매우 명확합니다. 그러나 더 정확하게 말하면 단면 분석을 수행한다고 가정하면 핵심 가정은 IIA (무관 한 대안의 독립성)입니다. 데이터를 IIA 가정에 적합하게 강요 할 수 없으므로 테스트하고 만족하기를 바랍니다. Spss는 2010 년까지 테스트를 확실히 처리 할 수 ​​없었습니다. 물론 R은 그렇게하지만 mlogit postestimation 명령으로 제공되는 IIA 테스트를 stata로 마이그레이션하고 구현하는 것이 더 쉬울 수 있습니다.

IIA가 보유하지 않는 경우 혼합 다항 로짓 또는 중첩 로짓이 합리적인 대안입니다. 첫 번째는 눈부심 내에서 추정 할 수 있고, 두 번째는 훨씬 더 교묘 한 nlogit 명령으로 계산할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.