언급 한 바와 같이, 선형 회귀 분석에서 iid 오류 의 경우를 종종 고려하지만 , 이것은 가장 일반적인 선형 모형 (로지스틱 회귀 포함)에서 직접적으로 동등한 것은 아닙니다. 로지스틱 회귀 분석에서 우리는 일반적으로 모두 매우 엄격한 관계 (즉, 로그 확률에 대한 선형 영향)를 갖는 결과의 독립성을 가정합니다. 그러나 이것들은 동일하지 않은 임의의 변수를 초래하거나 선형 회귀의 경우와 같이 상수 항에 iid 오류를 더해 분해 할 수 없습니다.
당신이 경우 정말 응답이 IID 관계의 일종을 가지고 있음을 보여주고 싶은, 그 다음 단락 날 따라와. 이 아이디어가 구타를 조금 벗어나는 것임을 아십시오. 교수님의 인내심이 부족한 경우 최종 답변에 대해이 답변에 대한 완전한 크레딧을 얻지 못할 수 있습니다.
임의 변수 생성을위한 inverse-cdf 방법에 익숙 할 것입니다. 그렇지 않을 경우, 여기에 원기가있다 : 경우 누적 분포 함수가 F X를 , 나는 무작위로 생성 할 수 있습니다에서 그립니다 X 립니다 첫 번째는 임의 복용하여 Q ~ 제복 (0,1) 다음 계산 X = F - 1 X ( Q )엑스에프엑스엑스큐~ 균일 (0,1)엑스= F− 1엑스( q). 이것은 로지스틱 회귀와 어떤 관련이 있습니까? 응답에 대한 생성 프로세스에는 두 부분이 있다고 생각할 수 있습니다. 공변량을 성공 확률과 관련시키는 고정 부분, 및 고정 부분상의 조건부 랜덤 변수의 값을 결정하는 임의 부분. 고정 부분은 로지스틱 회귀의 링크 함수, 즉 의해 정의됩니다 . 랜덤 부분에 대해 F y ( y | p ) 를 확률 p가 있는 Bernoulli 분포의 cdf로 정의합니다 . 그러면 반응 변수 Y를 생각할 수 있습니다p = 종료 ( β영형+ β1x )에프와이( y| p)피 다음의 세 단계에 의해 생성되고 :와이나는
1.) 피나는= 만료 ( β영형+ β1엑스나는)
2.) 큐나는~ 균일 (0,1)
3.) 와이나는= F− 1( q나는| 피나는)
로지스틱 회귀 분석의 표준 가정은 가 iid라는 것입니다.큐나는