짧은 버전 :
로지스틱 회귀 및 프로 빗 회귀는 관측하기 전에 일정한 임계 값에 따라 이산화되는 연속 잠재 변수를 포함하는 것으로 해석 될 수 있음을 알고 있습니다. 포아송 회귀에 대해 유사한 잠재 변수 해석이 가능한가? 불연속 결과가 두 개 이상일 때 이항 회귀 (예 : 로짓 또는 프로 빗)는 어떻습니까? 가장 일반적인 수준에서 잠재적 변수 측면에서 GLM을 해석하는 방법이 있습니까?
긴 버전 :
이진 결과에 대한 프로 빗 모델의 동기를 부여하는 표준 방법은 다음과 같습니다 (예 : Wikipedia ). 예측 변수 X 에 조건부로 분포 된 관찰되지 않은 / 잠재적 인 결과 변수 가 있습니다. 이 잠재 변수는 임계 값 프로세스를 거치므로 실제로 관찰되는 불연속 결과는 Y ≥ γ 인 경우 u = 1 이고 Y < γ 인 경우 u = 0 입니다. 이것은 X가 주어질 때 u = 1 의 확률로 이어 집니다평균 및 표준 편차, 한계의 함수 노멀 CDF의 형태를 취할 및 회귀의 기울기 의 각각. 그래서 프로 빗 모델의 잠재 회귀 기울기를 추정하는 방법으로 동기를 에 .
이것은 Thissen & Orlando (2001)의 아래 그림에 나와 있습니다. 이 저자들은 우리의 목적을 위해 프로 빗 회귀와 매우 비슷하게 보이는 항목 반응 이론의 정상적인 ogive 모델에 대해 기술적으로 논의하고 있습니다 (이 저자 는 X 대신에 를 사용 하고 확률은 일반적인 P 대신 T 로 작성됩니다 ).
로지스틱 회귀 분석 은 거의 같은 방식으로 해석 할 수 있습니다 . 유일한 차이점은 이제 관찰되지 않은 연속 X가 주어진 정규 분포가 아닌 로지스틱 분포를 따른다는 것 입니다. 왜 Y 가 정규 분포가 아닌 로지스틱 분포를 따르는 지에 대한 이론적 논증 은 조금 덜 명확합니다. 실제로 어떤 모델을 사용 하느냐가 중요합니다. 요점은 두 모델 모두 매우 간단한 잠재 변수 해석을 가지고 있다는 것입니다.
비슷한 모양의 (또는 지옥처럼 보이지 않는) 잠재 변수 해석을 다른 GLM 또는 모든 GLM에 적용 할 수 있는지 알고 싶습니다 .
이항 결과 (예 : Bernoulli 결과 만이 아님) 를 설명하기 위해 위의 모델을 확장하더라도 나에게는 분명하지 않습니다. 아마도 하나의 임계 값 γ 대신에 다중 임계 값 (관찰 된 개별 결과의 수보다 하나 적은)이 있다고 상상함으로써이를 수행 할 수 있습니다. 그러나 우리는 임계 값에 일정한 간격을 두는 것과 같은 임계 값을 적용해야합니다. 세부 사항을 해결하지는 않았지만 이와 같은 것이 작동 할 수 있다고 확신합니다.
포아송 회귀의 경우로 이동하면 나에게 분명하지 않습니다. 이 경우 임계 값 개념이 모델을 생각하는 가장 좋은 방법인지 확실하지 않습니다. 또한 잠재적 결과가 무엇인지 생각할 수있는 분포가 확실하지 않습니다.
이에 대한 가장 바람직한 해결책은 해석의 일반적인 방법이 될 것입니다 어떤 이 일반적인 솔루션은 의미했다하더라도 - 어떤 배포판 또는 기타와 잠재 변수의 측면에서 GLM을 다른 로짓 / 프로 빗 회귀에 대한 평소보다 잠재 변수 해석. 물론 일반적인 방법이 로짓 / 프로 빗에 대한 일반적인 해석에 동의하지만 자연스럽게 다른 GLM으로 확장된다면 훨씬 더 차가울 것입니다.
그러나 일반적인 GLM 사례에서 이러한 잠재 변수 해석이 일반적으로 사용 가능하지 않더라도 위에서 언급 한 이항 및 포아송 사례와 같은 특수 사례의 잠재 변수 해석에 대해서도 듣고 싶습니다.
참고 문헌
Thissen, D. & Orlando, M. (2001). 두 가지 범주로 분류 된 항목에 대한 항목 응답 이론. D. Thissen & Wainer, H. (Eds.), Test Scoring (pp. 73-140). Mahwah, NJ : Lawrence Erlbaum Associates, Inc.
2016-09-23 수정
GLM이 잠복 변수 모델이라는 한 가지 사소한 의미가 있습니다. 즉 "잠재적 변수"로 추정되는 결과 분포의 매개 변수를 항상 볼 수 있다는 것입니다. 즉, 직접 관찰하지 않습니다. 예를 들어, 포아송의 속도 매개 변수는 데이터에서 추론합니다. 이 해석에 따르면 때문에, 이것은 내가 찾고 정말 무엇을 오히려 사소한 해석 될, 그리고 생각 있는 (물론 다른 많은 모델의!) 선형 모델 것은이다 "잠재 변수 모델." 예를 들어, 정규 회귀 분석에서 X가 주어지면 정상 Y 의 "잠재적" 를 추정합니다.. 따라서 이것은 잠재 변수 모델링과 매개 변수 추정을 혼동시키는 것으로 보입니다. 예를 들어, 포아송 회귀 분석에서 필자가 찾고있는 것은 관측 된 결과에 포아송 분포가 왜 있어야하는지에 대한 이론적 모델과 비슷할 것입니다. 잠재적 인 의 분포 , 선택 과정이있는 경우 등. 그렇다면 (아마도 결정적으로?) 추정 가능한 GLM 계수를 이러한 잠재 분포 / 프로세스의 매개 변수로 해석 할 수 있어야합니다. 잠재 정규 변수에서의 평균 이동 및 / 또는 임계치 γ 에서의 이동으로 프로 빗 회귀의 계수를 해석한다 .